PCX 




WELTORGANISATION FOR GEISTIGES EIGENTUM 

Internationales BUro 

INTERNATIONALE ANMELDUNG VEROFFENTLICHT NACH DEM VERTRAG tJBER DIE 
INTERNATIONALE ZUSAMMENARBEIT AUF DEM GEBIET DES PATENTWESENS (PCT) 



(51) Internationale Patentklassiflkation ^ : 
G06F 15/76 



A2 



(11) Internationale Verdfrentiichungsnummer: WO 99/44147 

2. September 1999 (02,09.99) 



(43) Internationales 

Verdfrentlichungsdatum: 



(21) Internationales Aktenzeichen: PCT/DE99/00504 

(22) Internationales Anmeldedatum: 25. Februar 1999 (25.02.99) 

(30) Prioritatsdatcn: 

198 07 872.2 25. Februar 1998 (25.02.98) DE 

(71) Anmelder (JUr alle Bestimmungsstaaten ausser US): PACT IN- 

FORMATIONSTECHNOLOGIE GMBH [DE/DE); Thcle- 
mannstrasse 15, D-81545 MUnchen (DE). 

(72) Erfinder; und 

(75) Erflnder/Anmelder (nur JUr US): VORBACH, Martin 
[DE/DE]; (DE). MONCH, Robert [DE/DE]; Hagebutten- 
weg 36, D-76149 Karlsruhe (DE). 

(74) Anwalt: PIETRUK, Claus, Peter, Im Speitel 102» 0^76229 
Karlsruhe (DE). 



(81) Bestimmungsstaaten: AL, AM, AT, AU, AZ, BA, BB, BG, 
BR, BY, CA, CH, CN, CU, CZ, DE, DK, EE, ES, FI, GB, 
GD, GE, GH, GM, HR, HU, ID. IL, IN, IS, JP, KE, KG. 
KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MD. MG, MK, 
MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, 
SK, SL, TJ, TM, TR, TT, UA, UG, US, UZ, VN, YU. ZW, 
ARIPO Patent (GH, GM, KE, LS, MW, SD, SL, SZ, UG, 
ZW), eurasisches Patent (AM, AZ, BY, KG, KZ, MD, RU, 
TJ, TM), europaisches Patent (AT, BE, CH, CY, DE, DK, 
ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT. SE). OAPI 
Patent (BF, BJ, CF. CX5, CI, CM, GA, ON, GW, ML. MR, 
NE, SN, TD, TG). 



Veroffentlicht 

Ohne internationalen Recherchenbericht und erneut zu 
verqffentlichen nach Erhalt des Berichts. 



(54) TiUe: METHOD FOR CACHEING CONHGURATION DATA OF DATA FLOW PROCESSORS AND MODULES WITH A TWO- 
OR MULTIDIMENSIONAL PROGRAMMABLE CELL STRUCTURE (FPGAs. DPGAs OR SIMILAR) ACCORDING TO 
A HIERARCHY 



(54) Bezeichnung: VERFAHREN ZUM HIERARCHISCHEN CACHEN VON KONHGURATIONSDATEN VON DATEN- 
FLUSSPROZESSOREN UND BAUSTEINEN MIT ZWEI- ODER MEHRDIMENSIONALER PROGRAMMIER- 
BARER ZELLSTRUKTUR (FPGAs, DPGAs, o.dgl.) 



J11Q4 



0101 



Reference 
trigger -> ID 
(LUTI) 



0103 



0102 



VMd ? ^ >-^!^?* ^rig8erfl00i^ >-n^ 



(57) Abstract 

Up until now, a central and global unit 
have been integrated into one module which 
processes all of the configuration requests. The 
invention provides for a plurality of active units 
which can take over this task. These units 
are arranged in a hierarchy. A request from 
the lowest level is only transferred to the next 
highest level if the request cannot be processed. 
The highest level is connected to an internal 
or external higher-order configuration memory 
which contains all the configuration data ever 
required for this programme run. The tree 
structure of the configuration units enables a 
kind of cacheing of the configuration data. The 
configurations are mainly accessed locally. In 
the worst case scenario, a configuration has to 
be loaded from the higher-order configuration 

memory in case the relative data are not available In any of the CTs (configuration tables) in the hierarchy. 
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(57) Zusammenfassung 

Anstatt wie bisher eine zentrale und globale Einheit in einen Baustcin zu integricrcn, welche alle Konfigurations-Anfoixlerungcn 
bearbeitet, cxisticren nun cine Mehrzahl von hicrarchisch angeordneten aktiven Einheiten, welche diese Aufgabe abcmehmen kdnnen. 
Dabei wird eine Anfoidening von der tiefstcn Ebene nur dann an die nachst hCher gelegene Ebene weitergeleitet, wenn die 
Anfoiderung nicht bearbeitet werden konnte. Die hSchst gelegene Ebene ist an einen intemen oder extemen Ubergeordneten 
Konfigurationsspeicher angeschlossen, der alle jemals fQr diesen Programmlauf bendtigten Konfigurationsdaten enthSlt. Durch die 
Baumstruktur der Konfigurationseinheiten wird eine Art Cacheing der Konfigurationsdaten erreicht Zugriffe auf Konfigurationen finden 
hauptsSchlich lokal statt Im ungQnstigsten Fall muss eine Konfiguration aus dem iibergeordneten Konfigurationsspeicher geladcn werden, 
falls die betreffenden Daten in keiner der hierarchisch angeordneten CTs vorhanden sind. 
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Verfahren zum hierarchischen Cachen von 
Konf igurationsdaten von Datenf luliprozessoren und 
Bausteinen mit zwei- oder mehrdimensionaler 
programmierbarer Zellstruktur (FPGAs, DPGAs, o. dgl . ) 

Hintergrund der Erf indung 
Stand der Technik 

Der Stand der Technik, welcher diese Patentschrift 
zugrunde liegt, ist durch die Patentanmeldung 196 54 
84 6,2-53 (Verfahren zum selbstandigen dynamischen 
Umladen von Datenf luBprozessoren (DFPs) sowie Bausteinen 
mit zwei- oder mehrdimensionaler programmierbaren 
Zellmatrix (FPGAs, DPGAs, o.dgl.) und der 
Patentanmeldung 196 54 593.5-53 (Umkonf igurierungs 
Verfahren fur programmierbare Bausteine zur Laufzeit) 
beschrieben. Darin wird ein Verfahren zur Konf iguration 
und Umkonf iguration von DFPs, sowie FPGAs, DPGAs und 
ahnlichen Bausteinen nach dem Stand der Technik, 
beschrieben, bei dem ein separat ausgestalteter zentral 
ubergeordneter Mikrokontroller-ahnlicher Baustein die 
Verteilung von Konf igurationsdaten an mehrere 
untergeordnete, weitgehend passive Steuereinheiten 
iibernimmt . 

Probleme 

Durch den Einsatz einer zentralen und globalen Einheit, 

welche die Rekonf iguration von Teilen (z.B. Zellen 

(CELs)) eines oder mehrerer Bausteine steuert, kommt es 

zu Engpassen, wenn viele verschiedene Rekonf igurations- 
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Anfragen auf einmal behandelt werden miissen. Die 
Vorteile der Parallelitat, der beschriebenen Bausteine, 
wird durch eine solche zentrale Einheit stark 
eingeschrankt^ da sie den typischen "Flaschenhals" 
darstellt und die Verarbeitung der Daten dadurch 
erhebiich verlangsamt . 

Weiterhin ist die Zuordnung der Ereignisquelle zu der zu 
ladenden Konf iguration problematisch, da mit absoluten 
Adressen des Konf igurationsspeichers gearbeitet wird. 
Die Rekonfigurations-Einheit muli also eine Art 
Speicherverwaltungssystem beinhalten, welche, ahnlich 
wie in einem Betriebssystem, mitprotokolliert, welche 
Speicherbereich von welcher Konf iguration benutzt 
werden . 

Ein zusatzliches Problem stellt die Verwaltung der 
Resourcen (z.B. CELs) dar. Es muii sichergestellt sein, 
daJJ jede CEL nur genau einmal an einen von einer 
Rekonfigurationsanfrage gestartetem Algorithmus vergeben 
wird und zwar denjenigen der auch die restlichen 
umliegenden CEL verwendet, da ansonsten Deadlocks 
auftreten konnen. 

Urn die Problematik der Umkonf iguration nochmals zu 
verdeutlichen wird folgendes Beispiel gegeben: 
Eine Matrix aus CELs ist unkonf iguriert und im RESET- 
Zustand. Jede CEL ist in der Lage anzuzeigen, ob sie 
sich in einem umkonf igurierbaren Zustand befindet. Alle 
CELs in der Matrix sind bereit konfiguriert zu werden; 
befinden sich also in einem umkonf igurierbaren Zustand. 
Eine erste Konf igurationsroutine (KRl) wird geladen, 
wobei die Matrix nicht vollstandig benutzt wird. Die 
konfigurierten CELs heben die Anzeige, dali sie sich in 
einem konf igurierbaren Zustand befinden auf. In eine 
Gruppe der noch nicht konfigurierten CELs wird eine 
zweite, von der Ersten unabhangigen, 
Konf igurationsroutine (KR2) geladen. Eine dritte 
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Konfiguration kann nicht geladen werden, da diese CELs 
der ersten und/oder zweiten Konf igurationsroutine (KR3) 
benStigt, die sich aber in keinem umkonf igurierbaren 
Zustand befinden, da sie benutzt werden, 
KR3 muB so lange angehalten werden, bis die benotigten 
CEL freigegeben wurden, d.h. KRl und KR2 terminiert 
haben . 

Wahrend der Ausfuhrung von KRl und KR2 kommt eine 
Ladeanf orderung fur eine vierte Konf igurationsroutine 
(KR4) und eine funfte Konf igurationsroutine (KR5) hinzu, 
die alle nicht sofort geladen werden konnen, da sie CELs 
benutzen, die von KRl und KR2 verwendet werden. KR3 und 
KR4 benutzen teilweise die selben CELs, KR5 benutzt 
keine der CELs von KR3 und KR4 . 

Urn KR3-5 ordentlich nachzuladen existieren folgende 
Forderungen : 

1. KR3-5 sollen so geladen werden, daJi die zeitliche 
Reihenfolge gemafi den Ladeanf orderungen inoglichst 
beibehalten wird. 

2. M5glichst viele KR die unabhangig von einander sind, 
also keine gemeinsamen CELs besitzen, sollen geladen 
werden, urn ein HochstmalJ an Parallelitat zu erhalten. 

3. Die KRs diirfen sich nicht gegenseitig blockieren, 
d.h. KR3 ist teilweise geladen, kann jedoch nicht weiter 
geladen werden, da andere CELs durch die teilweise 
geladene KR4 blockiert sind; wahrend KR4 auch nicht 
weiter geladen werden kann, da wiederum benotigte CELs 
durch KR3 blockiert sind. Dies fuhrt zu einer typische 
Deadlock-Situation . 

4 . Dem Compiler, der die KRs generiert hat ist es nicht 
moglich das zeitliche Zusammenspiel der KRs zu erkennen 
und so auf zulosen, daii es zu keiner Konf liktsituation . 
kommt . 



3 



wo 99/44147 



PCT/DE99/00504 



Dabei soli das Verhaltnis zwischen den Aufwand fur eine 
zu realisierende Schaltung und eines optimalen 
Ergebnisses moglichst gut sein, d.h. Ziel der Erfindung 
ist es mit moglichst geringem Aufwand eine flexible, 
parallele, Deadlock-f reie Konf iguration zu ermoglichen, 
die mit wenig Zeit- und Rechenaufwand durchgefiihrt 
werden kann. Dabei miissen folgende Grundprobleme gelost 
werden : 

- Wiirde nur KR3 geladen werden, ware das Verfahren 
Deadlock-frei, doch nicht optimal, da auch KR5 geladen 
werden kSnnte. 

- Wird KR3 geladen, KR4 nicht, jedoch KR5 muB KR4 so 
vorgemerkt werden, dafi es bei einem nachf olgenden 
Ladevorgang die hochste Prioritat besitzt, was einen 
hohen Verwaltungsaufwand bedeutet . 

Die Deadlockfreiheit ist durch das nachfolgend 
beschriebene Verfahren gegeben: 

Verbesserung durch die Erfindung, Aufgabe 

Die Grundaufgabe der vorliegenden Erfindung ist eine 
Einheit - im folgenden Konf igurationstabelle (CT) 
genannt ~, die hierarchisch aufgebaut ist und auf jeder 
Ebene mehrfach vorkoramen kann, wobei sich die Zahl der 
CTs von der untersten Hierarchiestuf e zur obersten so 
verringert, daB auf der hochsten Ebene genau eine CT 
vorhanden ist. Jede CT konfiguriert und kontrolliert 
unabhangig von anderen und parallel eine Mehrzahl von 
konf igurierbaren Elementen (CELs) . CTs hoherer 
Hierarchiestufen konnen Konf igurationsroutinen fur 
tieferliegende CTs zwischenspeichern . Benotigen mehrere 
der tieferliegenden CTs ein und dieselbe 
Konfigurationsroutine, wird diese bei einer 
hoherliegenden CT zwischengespeichert und von den 
einzelnen CTs abgerufen, wobei die hoherliegende CT die 
betreffende Konfigurationsroutine nur ein Mai aus einem 
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globalen gemeinsamen Konf igurationsspeicher abruft, 
wodurch ein Cache-Effekt erzielt wird, Abseits 
konf igurierbarer Bausteine kann die vorliegende 
Erfindung als Cacheverf ahren fur Instruktions- und 
Datencache in Mikroprozessoren, DFP oder dgl. mit 
mehreren Rechenwerken eingesetzt werden. Dabei konnen, 
je nach Anwendung, einige der im folgenden beschriebenen 
Einheiten entfallen (z.B. FILMO) , am hierarchischen 
Aufbau andert sich jedoch grundlegend nichts. Deshalb 
wird dieser Einsatz als eine Teilmenge betrachtet und 
nicht weiter darauf eingegangen. Ein erheblicher Vorteil 
des beschriebenen Verfahrens gegeniiber gewohnlichen 
Cacheverf ahren ist, daB Daten und/oder Code selektiv, 
d.h. anhand von exakt auf den Algorithmus abgestimmten 
Methoden gecached werden. 

Ebenfalls ermoglicht die vorliegende Erfindung das 
vollstandig deadlockf reie Umkonf igurieren von grolien 
Zellstrukturen. 

Beschreibung der Erfindung 

Anstatt wie bisher eine zentrale und globale Einheit in 
einen Baustein zu integrieren, welche alle 
Konfigurations-Anforderungen bearbeitet, existieren nun 
eine Mehrzahl von hierarchisch (Baumstruktur) 
angeordneten aktiven Einheiten, welche diese Aufgabe 
ubernehmen konnen. 

Dabei wird eine Anforderung von der tiefesten Ebene (den 
Blattern in der Hierarchie) nur dann an die nachst hoher 
gelegene Ebene weitergeleitet, wenn die Anforderung 
nicht bearbeitet werden konnte. Diese Schritte werden 
fur alle vorhandenen Ebenen wiederholt, bis die hochst 
gelegene Ebene erreicht ist. 

Die hochst gelegene Ebene ist an einen internen oder 
externen ubergeordneten Konf igurationspeicher 
angeschlossen, der alle jemals fiir diesen Programlauf , 
benotigten Konf igurationsdaten enthalt . 
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Durch die Baumstruktur der Konf igurationseinheiten wird 
eine Art Cacheing der Konf igurationsdaten erreicht. 
Zugriffe auf Konf igurationen finden hauptsSchlich lokal 
statt. Im ungiinstigsten Fall muss eine Konf iguration aus 
den ubergeordneten Konf igurationsspeicher geladen 
werden, falls die betreffenden Daten in keiner der 
hierarchisch angeordneten CTs vorhanden sind. 
Deadlocks werden verhindert, indem eine feste zeitliche 
Abfolge der zu ladenden Konf igurationen eingefuhrt wird 
und die Konf igurationen zu einer Liste zusammengef alit 
werden. Die Statusinformationen der CEL werden vor dem 
Laden gesichert und bleiben dadurch wahrend des 
Abarbeitens der gesamten Liste von Konf igurationen 
unverandert . 

Die Grundlagen der CT 

Eine Konf igurat ionstabelle (CT) ist eine aktive Einheit, 
die auf Synchronisationssignale, sogenannten Trigger, 
reagiert. Die Trigger werden von einer zwei- oder 
mehrdimensionalen Matrix aus elektronischen Baugruppen, 
fiir gewohnlich arithmentischen oder logischen Einheiten, 
Adressgeneratoren, Recheneinheiten, o.a. - im folgenden 
konfigurierbare Elemente (CEL) genannt - generiert, 
Anhand des auftretenden Trigger wird eine bestimmte 
Aktion innerhalb der CT ausgelost. Dabei ist es Aufgabe 
der CT die Steuerung einer Mehrzahl von CELs zu 
ubernehmen und deren arithmetischen und/oder logischen 
Operationen zu bestimmen. Insbesondere mussen CELs 
konfiguriert und umkonf iguriert werden. Diese Aufgabe 
ubernimmt eine CT, indem sie eine Mehrzahl von moglichen 
Konf igurationsroutinen (KR) , die ihrerseits jeweils aus 
einer Mehrzahl von einzelnen Konf igurationsworten (KW) 
bestehen, verwaltet und eine Mehrzahl von CELs aufgrun'd 
von Triggerbedingungen mit einer oder mehrerer der KR 
konfigurieren. Dabei erhalt eine CEL jeweils eines oder 
mehrere der Konf igurationsworte, die mit der Adresse der 
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zu konfigurierenden CEL versehen sind. Eine KR muli dabei 
vollstandig und korrekt auf eine Mehrzahl von CELs 
abgebildet werden, wobei mehrere CELs zu Gruppen 
zusanunengef afJt sein konnen; die mit jeweils 
unterschiedlichen, aber vollstandig ausgefuhrten KRs 
konfiguriert werden. Dabei sind alle CELs in einer 
Gruppe so verschaltet, daft nach Feststellung einer 
notwendigen Umkonf igurierung alle gruppierten CELs durch 
ein gemeinsames Signal (ReConfig) mitgeteilt wird, daft 
jede CEL die Datenverarbeitung zu beenden und in einen 
umkonf igurierbaren Zustand uberzugehen hat, 

Grundlagen der deadlockfreien Umkonf igurat ion 

Bei zur Laufzeit umkonf igurierbaren Systemen tritt das 
Problem auf, daft das System in einen Zustand gelangen 
kann, in dem jeweils zwei Telle aufeinander warten und 
somit eine Deadlock Situation eingetreten ist. 

Dieses Problem konnte vermieden werden, indem eine neue 
Konfiguration immer nur ganz oder gar nicht in das 
System geladen wird, oder eine Art Timeout-Verf ahren 
eingesetzt wird. 

Dadurch entstehen ein Reihe von Nachteilen (benotigter 
Platz, Laufzeit etc) und Problemen, wie zum Beispiel: 

- Vorgehen, falls eine Konfiguration nicht geladen 
werden kann. 

- Verwaltung der Reihenfolge, in der die Konf igurationen 
geladen werden 

- Performance Einbruch, da andere Konf igurationen, 
welche eventuell in die CELs geladen werden konnten, 
nicht beachtet werden. 

Mit dem folgend beschriebenen Verfahren konnen diese 
Probleme beseitigt werden, Es wird von einem DFP System 
nach dem Stand der Technik ausgegangen. 
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Von einer CEL aus, wird ein Trigger-Signal an eine CT 
gesendet* Diese CT stellt die Triggerquelle fest und 
wahlt durch eine Look-Up Tabelle eine zu ladende 
Konf iguration (KR) aus . Die eingehenden Triggersignale 
werden gesperrt, es werden keine weiteren Trigger bis 
zur kompletten Abarbeitung der aktuellen Konf iguration 
akzeptiert. Eine Konf iguration besteht aus mehreren 
Befehlen, welche an eine Menge von CELs iibertragen wird- 
In einem zur Laufzeit konf igurierbaren System ist 
allerdings nicht sichergestellt, dafi jeder 
Konfigurations-Befehl (KW) auch ausgefuhrt werden kann. 
Dies kann zum Beispiel daran scheitern, dali das 
adressierte konf igurierbare Element (CEL) seine Aufgabe 
noch nicht beendet hat und somit keine neuen 
Konfigurationsdaten entgegen nehmen kann. Urn einen 
Performance Einbruch zu verhindern, werden alle 
Konfigurationsbefehle, welche nicht abgearbeitet werden 
konnten (da sich die entsprechenden CELs in einem nicht 
umkonfigurierbaren Zustand befanden und die 
Konf iguration ablehnten (REJECT) ) , entsprechend eines 
FIFOs hinter den letzten sich in einem (nachfolgend 
naher beschrieben) speziellen Speicher (FILMO) 
befindenden Konf igurationsbef ehl geschrieben. Danach 
wird der nachsten Konf igurationsbefehl, nach dem 
gleichen Verfahren, abgearbeitet. Dies wiederholt sich 
solange, bis das Ende einer Konf iguration erreicht 
wurde . 

Danach geht die CT, wieder in den Zustand iaber, in dem 
sie Trigger-Signale akzeptiert, um eventuell weiter 
Konfigurationen zu laden. In diesem Zustand arbeitet die 
CT den FILMO in regelmaliigen Abstanden, durch einen 
Zeitgeber gesteuert, ab. 
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Eine Priorisierung der zu ladenden Konf igurationen wird 
erreicht, indem die CT den Speicher FILMO durchlauft, 
bevor die eigentlich zu ladende Konf iguration bearbeitet 
wird. Durch eine FIFO-ahnliche Struktur des FILMO wird 
sichergestellt, dali KWs, welche wahrend vorhergehenden 
Triggeranforderungen nicht vollstandig abgearbeitet 
werden konnten, automatisch eine hohere Prioritat vor ■ 
den neu abzuarbeitenden WK erhalten. Bei der Abarbeitung 
des Speichers (FILMO) wird jedes durch einen 
Konfigurationsbefehl adressierte konf igurierbare Element 
(CEL) vor Oder wahrende des Sendens eines KWs getestet, 
Ob es sich im Zustand "umkonf igurierbar" befindet. 1st 
dieser Zustand "umkonf igurierbar" (ACCEPT), werden die 
Daten libertragen und aus dem Speicher FILMO gel5scht. 
1st der Zustand "nicht umkonf igurierbar" (REJECT), 
bleiben die Daten im FILMO und werden beim nachsten 
Durchlauf erneut abgerarbeitet . Die CT verarbeitet den 
nachsten Eintrag im FILMO. 

Dies wiederholt sich solange, bis das Ende des FILMO 
erreicht ist. Danach wird die eigentliche, durch das 
Auftreten des Trigger-Signals aktivierte Konf iguration 
abgearbeitet. Der Aufbau des FILMOs entspricht dabei dem 
FIFO Prinzip, das heil^t, es werden die altesten Eintrage 
zuerst verarbeitet. Urn den FILMO auch abzuarbeiten, wenn 
keine neue KR geladen wird, wird der FILMO von einem 
Timer gesteuert in regelmaliigen Abstanden durchlauf en. 

Die ubrigen, nicht beteiligten konf igurierbaren Elemente 
(CEL) arbeitet wahrend dieser Phase parallel weiter und 
wird nicht in ihrer Funktion beeinfluBt. Dadurch kann 
der Fall eintreten, dafi wahrend die CT den FILMO 
abarbeitet, eine oder mehrere konf igurierbaren Elemente 
(CELs) in den Zustand "umkonf igurierbar" libergehen. Da 
die CT sich mit der Abarbeitung an einer beliebigen 
Stelle innerhalb des FILMOs befinden kann, konnte 
folgender Fall eintreten: 
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Die CT versucht einen ersten Befehl abzuarbeiten dessen 
adressiertes konf igurierende Element (CEL) sich nicht in 
dem Zustand "umkonf igurierbar" befindet. Die CT fahrt 
somit mit dem nachsten Befehl (KW) fort. Zur selben Zeit 
gehen ein oder mehrere konf igurierbaren Elemente in den 
Zustand "umkonf igurierbar" iiber, darunter auch das 
konf igurierbare Element, welches durch den ersten 
Konf igurationsbef ehl hatte beschrieben werden konnen . 
Die CT verarbeitet einen zweiten Konf igurationsbef ehl 

(KW) , welcher das gleiche konf igurierbare Element (CEL) 
benutzt, wie der erste Konf igurationsbef ehl, allerdings 
aus einer anderen Konf iguration stammt. Zu diesem 
Zeitpunkt, befindet sich das konf igurierbare Element 

(CEL) in dem Zustand "umkonf igurierbar" und der Befehl 
kann erfolgreich abgerarbeitet werden. 

Dadurch ist nicht mehr sichergestellt , dafi die 
Konfiguration, welche zuerst geladen werden sollte, auch 
tatsachlich zuerst f ertiggestellt wird. Es konnen nun 
zwei teilweise fertige Konf igurationen existieren, 
welche jeweils konf igurierbare Elemente der anderen 
Konfiguration benotigen, um vollstandig geladen zu 
werden. Eine Deadlock-Situation ist eingetreten, die in 
Figur 18 verdeutlicht wird. Konfiguration A und 
Konfiguration B sollen konfiguriert werden. Die CT hat 
den schraf f ierten Teil von Konfiguration A und 
Konfiguration B bereits geladen. Konfiguration A 
benotigt zur Fertigstellung noch den hell-doppelt 
schraff ierten Bereich von Konfiguration B, und 
Konfiguration B benotigt zur Fertigstellung noch den 
dunkel-doppelt schraf f ierten Bereich von Konfiguration 
A. Da beide Konf igurationen noch nicht vollstandig 
abgeschlossen sind, und somit auch nicht f unktionsf ahig, 
tritt fiir keine der beiden Konf igurationen der 
Terminierungszustand ein, in dem eine der 
beiden Konf igurationen entfernt wiirde. Beide 
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Konfigurationen warten darauf, daii die noch benotigten 
konf igurierbaren Elemente freigegeben werden. 

In dem vorliegenden Verfahren wird ein Deadlock 
verhindert, indem die CT vor der Abarbeitung des FILMOs 
die Zustande aller konf igurierbarer Elemente erfalit und 
danach bis zur Beendigung des Vorgangs keine Anderungen 
mehr zulafit, bzw. auftretende Anderungen ignoriert . Mit 
anderen Worten, es werden entweder die Zustande aller 
konfigurierbaren Elemente vor der Abarbeitung des FILMOs 
gesichert oder eine Veranderung der Zustande wahrend der 
Abarbeitung des FILMOs verhindert • Eine mogliche 
technische Ausfuhrung ist der Einsatz eines Registers in 
jedem konfigurierbaren Element, in das der Zustand vor 
Abarbeitung des FILMOs gesichert wird. Die CT arbeitet 
nur auf Basis der erfaibten Zustanden und nicht mit den 
aktuellen Zustanden der konfigurierbaren Elemente. 
Dadurch ist sichergestellt , daB jeder zu bearbeitende 
Befehl (KW) den gleichen Zustand der konfigurierbaren 
Elemente (CELs) vorfindet. Dieser Schritt schliefit nicht 
aus, daB ein oder mehrere konfigurierbaren Elemente 
wahrend der Abarbeitung des FILMOs, in den Zustand 
"umkonf igurierbar" ubergehen. Diese Anderung ist fur die 
CT wahrend der Verarbeitung lediglich nicht sofort 
sichtbar, sondern erst zu Beginn des nachsten 
Durchlauf s . 

Konfigurations-Reihenfolgen 

Zur Konf iguration bestimmter Algorithmen ist es 
unbedingt notwendig, die Reihenfolge in der die KW in 
die CEL geschrieben werden exakt einzuhalten. 
Beispielsweise ist es sinnvoll vor Anschluft einer CEL an 
ein Bussystem, zuerst das Bussystem zu konf igurieren, 
damit die CEL nicht an einen von einer anderen Routine 
benutzten Bus angeschiossen wird. Mit anderen Worten, 
eine CEL wird nur konf iguriert , wenn vorher die 
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entsprechenden Busverbindungen konfiguriert werden 
konnten. 

In dem erf indungsgemalJen Verfahren wird die Einhaltung 
eines festen Ablaufes wie folgt erreicht: 
Konfigurationsworte (KWs) , deren Ausfuhrung entscheidend 
fur die Konf iguration der nachf olgenden KWs sind, werden 
besonders gekennzeichnet (und im f olgenden KWR genannt) . 
Schlagt die Konf iguration eines solchen KWR fehl, werden 
alle nachfolgenden KWs innerhalb der betreffenden 
Konfigurationsroutine (KR) auf den FILMO geschrieben und 
in diesem Durchlauf nicht ausgefuhrt. Auch beiin 
Durchlaufen des FILMOs werden samtliche KWs, die sich in 
der Reihenfolge hinter einem KWR befinden, dessen 
Konfiguration fehlschlug, in dem aktuellen Durchlauf 
nicht ausgefuhrt. 

Cache-Verfahren 

Die CT-Struktur ist hierarchisch aufgebaut, d.h. es 
existieren in einem Baustein mehrere CT~Ebenen . Die 
Anordnung entspricht vorzugsweise einer Baumstruktur 
(CT-Tree) . Dabei ist der Wurzel-CT (Root-CT) ein 
externer Konf igurationsspeicher (ECR) , der samtliche KRs 
enthalt zugeordnet, wahrend den Blattern die 
konfigurierbaren Elemente (CELs) zugeordnet sind, die 
einzelne KRs aufrufen. Den CTs der mittleren Ebenen sind 
jeweils die konfigurierbaren Elemente zugeordnet, die 
sich auf derselben Hierarchiestuf e befinden. 
Jeder CT ist ein lokaler interner Speicher zugeordnet. 
Dieser Speicher wird partiell geloscht, wenn neu zu 
speichernde KRs keinen Platz mehr haben, oder dies 
explizit durch einen speziellen CT-Befehl (REMOVE) 
angefordert wird. Dabei erfolgt das Loschen KR-weise, 
anhand einer Loschstrategie, so daii bestenfalls nur die 
KR geloscht werden, die nicht mehr angefordert werden 
Oder explizit beim REMOVE-Bef ehl angegeben sind. 
Ebenfalls werden die KR einzeln geloscht, nur genau so 
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viele, daJi genau so viel Speicher frei ist, wie 
notwendig ist urn die neu zu ladende KR in den Speicher 
zu schreiben. Dadurch wird erreicht, dali moglichst viele 
KR zur Optimierung des Cache-Ef f ektes in dem Speicher 
verbleiben . 

Der Vorteil liegt darin, daft jede, einer beliebigen CTx 
untergordente CT, die sich also weiter oberhalb im CT- 
Baum befindet eine KR, die in der CTx gespeichert ist, 
nicht von dem- externen Konf igurationsspeicher ECR 
anfordert, sondern direkt von CTx erhalt. Dadurch ergibt 
sich eine Cachestruktur iiber mehrere Ebenen. Der 
Dateniibertragungsaufwand im CT-Baum und insbesondere die 
benotigte Speicherbandbreite des ECR wird erheblich 
gesenkt . 

Mit anderen Worten speichert jede CT die KRs der unter 
ihr liegenden CT zwischen. D.h. die tief erliegenden CTs 
erhalten die benotigten KRs direkt von den 
dariiberliegenden, ein Speicherzugrif f auf das externe 
ECR ist nicht notwendig. Nur wenn eine benotigte KR 
nicht in einer der hSherliegenden CTs bereits vorhanden 
ist, muli die KR uber einen Zugriff auf das ECR geladen 
werden. Dadurch ergibt sich einer besonders effiziente 
hierarchische Cache-Struktur fiir KRs. 

Auf Basis dieser Struktur ergeben sich auch mogliche 
Loschstrategien, die allerdings je nach Anwendung 
empirisch festgelegt werden sollten. Einige 
Moglichkeiten sind: 

- Loschen des altesten Eintrage 

- Loschen der kleinsten Eintrage 

- Loschen der groBten Eintrage 

- Loschen der am seltensten abgerufenen Eintrage 
Grundlage von CT-Hierarchien 

Um einen Cache-Effekt zu erzielen, werden CTs zu einer 
Hierarchie in Baumstruktur zusammengeschaltet . Zwischen 
den einzelnen Knoten (CTs) befindet sich ein Bussystem 
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(Inter-CT-Bus) , dali jeweils einen oberen Knoten (CTs) 
mit mehreren unteren Knoten (CTs) verbindet, Dabei 
fordern untere Knoten (CTs) Daten von den oberen Knoten 
(CTs) an, die oberen Knoten senden die Daten daraufhin 
an die unteren Knoten. Die unteren Knoten tauschen 
untereinander Statusinf ormationen aus, dazu werden die 
Netzwerke zwischen den hoheren Knoten verwendet, die 
entsprechend die Adressen auflosen miissen. 

CT-Hierarchie und Adressierung 

CT-Hierarchien sind so angeordnet, dafi zur Adressierung 
der einzelnen CTs ein Binarbaum verwendet werden kann. 
Das bedeutet, dafi das niederwertigste Adressbit die 
einzelnen Blatter des Baumes kennzeichnet und jedes 
weitere Adressbit jeweils eine Hierarchieebene hoher 
selektiert. Jede CT besitzt damit eine eindeutige 
Adresse . 

Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind: 
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Soli einer Gruppe von CTs eine ubergeordnete CT 
zugeordnet werden, werden mehrere Adressbits der Gruppe 
entsprechend zusammengef alit . 



14 



wo 99/44147 



PCT/DE99/00504 



Die nachfolgende Tabelle zeigt, wie die einzelnen 
Adressbits den jeweiligen Ebenen zugeordnet sind, dabei 
befindet sich auf Ebene 0 eine Gruppe mit 8 CTs 
(Adresbit 2 . . 0) : 
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Der Aufbau des Binarbaumes kann eindimensional oder 
mehrdimensional erfolgen, indem pro Dimension ein 
Binarbaum aufgebaut wird. 

Eine bestimmte CT (TARGET) wird adressiert, indem die 
initierende CT (INITIATOR) entweder die exakte 
Zieladresse angibt, oder TARGET relativ adressiert. 

Die Auswertung einer relativen Adresse wird im folgenden 
nahers beschrieben: 



Beispiel eines relativen Adressfeldes fiir eine 
zweidimensionale Adressierung: 
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Bitl5 ist gesetzt, wenn die CT der nachsthoheren 
Hierarchiestufe selektiert werden soil. 
Bitl4 kennzeichnet Broadcasts, selektiert also alle CTs . 
Die X/Y-Adressen geben die Adresse von TARGET ausgehend 
von der Adresse von INITIATOR an. 

Die Adressen sind vorzeichenbehaf tete "signed" Integer- 
Zahlen. Durch Addition der Y/X-Addressen des 
Adressfeldes. zu der aktuellen Adressposition, wird 
TARGET bestimmt. Jede Ebene besitzt eine bestimmte 
Adressbreite (Addresswidth) . Die Addierer entsprechen 
dieser Breite. 

Ein Uber- oder Unterlauf bei der Addition bedeutet, dali 
die adressierte CT nicht unterhalb des aktuellen Knotens 
liegt und die Adressanf orderung wird an die 
daruberliegende CT (den nachsthoheren Knoten) 
weitergegeben . 

Tritt kein Uber- oder Unterlauf auf, befindet sich 
TARGET unterhalb des aktuellen Knotens. Das auf der 
aktuellen Ebene berechnete Adressbit (vgl. Tabellen) 
selektiert den direkt unter dem aktuellen Knoten 
liegende CT. Von dieser aus wird jeweils anhand des 
entsprechend berechneten Adressbits die nachst tiefere 
CT (Knoten) selektiert. 

Priorisierung von Zugriffen in CT-Hierarchien 

Die Zugriffe auf den Inter-CT-Bus werden von einem 
Arbiter verwaltet. Dabei sind alle unteren Knoten gleich 
priorisiert. Der obere Knoten besitzt eine hohere 
Prioritat. Dadurch sind Zugriffe, die von einem hoheren 

Knoten nach unten ubertragen werden, oder bereits einen ^ 
weiten Weg vom INITIATOR aus zuriickgelegt haben anderen 
Zugriffen uberlegen, 

Der Grundaufbau einer CT 

Die nachfolgende Ubersicht liber die CT gibt einen 
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Uberblick uber die einzelnen Baugruppen. Die detailierte 
Beschreibung der Baugruppen wird im folgenden gegeben. 

Kern einer CT ist die Steuer-Statemachine (CTS) die 
samtliche Abarbeitungen von Konf igurationsroutinen (KRs) 
steuert. Der CTS zugeordnet ist, der Garbage-Kollektor 
(GO, der das Entfernen von KR aus dem Speicher (CTR) 
der CT steuert; das FILMO, das die Verwaltung der noch 
abzuarbeitenden KWs iibernimmt und die LOAD-Statemachine, 
die das Laden von KRs steuert. 

Der Speicher (CTR) ist als gewohnlicher Schreib-Lese- 
Speicher ausgestaltet , wobei alle technisch moglichen 
Implementierungen zum Einsatz kommen konnen, und wird 
zur lokalen Speicherung von KRs fur die jeweilige CT und 
deren untergeordnete CTs verwendet. Als Sonderfall kann 
der Speicher (CTR) auch als ROM, EPROM, EEPROM, Flash- 
ROM o.a. ausgestaltet sein, um den Baustein mit einer 
festen, ASIC oder PLD-ahnlichen (siehe Stand der 
Technik) Funktion zu versehen. 

Zur Generierung der CTR-Adressen werden vier als ladbare 
Zahler ausgestaltete Pointer verwendet: 

1. Free-Pointer (FP) . Zeigt auf den ersten freien 
Speicherplatz hinter der letzte KR im CTR. 

2. Garbage-Pointer (GP) . Zeigt auf einen durch den 
Garbage-Kollektor (GC) zu entfernenden Eintrag aus dem 
CTR. 

3. Move-Pointer (MP). Zeigt auf eine Speicherstelle im 
CTR, von der ein gultiges, nicht zu entfernendes 
Konfigurationswort (KW) , also einen Eintrag eines KR, an 
den durch GP definierten Eintrag kopiert/bewegt wird. 

4. Program-Pointer (PP) . Zeigt auf das momentan von der 
CTS ausgefiihrten KW. 
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KW werden Uber ein Ausgabe-Interface (OUT) an die 
zugeh5renden CELs weitergegeben . Die CELs quittieren 
(ACCEPT) , sof em sie sich in einem umkonf igurierbaren 
Zustand befinden den Empfang der KW. Wird ein KW nicht 
quittiert (REJECT) , wird es in einem FIFO-ahnlichen 
Speicher (FILMO) , zeitweise zwischengespeichert , urn zu 
einem spateren Zeitpunkt, ohne den Program-Pointer zu 
benutzen, erneut an die adressierte CEL geschrieben zu 
werden. . . 

Eine Aufforderung zur Abarbeitung eines KR erhalt die 
CTS durch Triggersignale . Die Triggersignale durchlaufen 
eine Maske, das ist ein Filter, der unerwunschte Trigger 
ausfiltert (ausmaskiert ) . Eine Maske kann nach dem Stand 
der Technik durch UND-Gatter (AND) aufgebaut werden, die 
einen Trigger mit einem Freigabe-Signal UND-verknupf t . 
Die Trigger werden iiber einen priorisierten Round-Robin- 
Arbiter (SCRR-ARB) in Binarsignale umgewandelt. Ein 
priorisierter Round-Robin-Arbiter verkniipft den Vorteil 
der Gleichberechtigung eines Round-Robin-Arbiters mit 
der Erkennung der nachsten Freigabe in einem Takt, also 
dem Vorteil eines Prioritats-Arbiter , 

Die maskierten Trigger werden als Adresse auf eine erste 
Lookup-Tabelle (LUTl) geschaltet, das ist ein Speicher, 
der dem als Adresse eingehenden Trigger das ID der 
betreffenden KR zuordnet und auf den Datenleitungen 
ausgibt . 

In einer zweiten Lookup-Tabelle {LUT2) wird die ID der 
KR der Adresse des Speicherplatzes der KR im CTR 
zugeordnet. Die zweite Lookup-Tabelle wird nicht nur zur 
Zuordnung von Trigger-Signalen verwendet, vielmehr 
benutzen Befehle, die eine ID als Parameter verwenden, 
die LUT2 ebenfalls zur Adress zuordnung . 
Die Zuordnung der Trigger-Signale zu den betreffenden 
IDs wird iiber den nachfolgend beschriebenen Befehl 
"REFERENCE" in die LUTl eingetragen. Die Verwaltung der 
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LUT2, also die Zuordnung der IDs zu den Adressen im CTR, 
geschieht automatisch durch die CTS und den GC. 

Zum besseren VerstSndnis der CT ist im folgenden ein 
moglicher Grundbefehlssatz dargestellt: 

1. BEGIN <ID> 

Durch BEGIN <ID> wird der Anfang einer 
Konfigurationsroutine gekennzeichnet • <ID> gibt die 
eindeutige Identif ikationsnummer der 
konfigurationsroutine an. 

2. STOP 

Durch STOP wird das Ende einer Konfigurationsroutine 
gekennzeichnet. An dieser Stelle beendet die 
Konfigurationstabelle (CT) die Abarbeitung der 
Konfigurationsroutine. Der Garbage-Kollektor (GC) 
beendet das Entfernen von Eintragen dieser 
Konfigurationsroutine . 

3. EXECUTE <ID> 

Springt zum Beginn (BEGIN <ID>) einer 
Konfigurationsroutine. Ist diese Routine nicht im 
Speicher der CT vorhanden, so wird sie von der 
daruberliegenden CT angefordert, bzw. aus dem Speicher 
geladen , 

4. LOAD <ID> 

Fordert die KR <ID> von der daruberliegenden CT an. 

5. REMOVE <ID> 

Ruft den GC auf , um die Konfigurationsroutine <ID> von 
BEGIN <ID> bis STOP aus dem Speicher der CT zu entfernen 
und die nachfolgenden Konf igurationsroutinen so weit 
vorzuschieben, dai^ kein Speicherloch durch die entfernte 
Konfigurationsroutine entsteht. 

6. PUSH <FORCED> <ADDRESS> <DATA> <EXIT> 

Schreibt die Konf igurat ionsdaten <DATA> an das Register 
<ADDRESS>. Ist <FORCED> gesetzt, werden die Daten auch 
geschrieben, wenn das RECONFIG-Flag des betreffenden 
Zielregisters nicht gesetzt ist. <EXIT> wird verwendet 
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und anzuzeigen, dali es sich urn ein KWR handelt, das bei 
einem REJECT die weitere Ausfuhrung der nachf olgenden 
KWRs abbricht, 

7. MASK <SR> <TRIGGER> 

Setzt die Trigger-Maske mit <TRIGGER>, bzw. setzt sie 
mit <TRIGGER> zuriick, abhangig von <SR> (Set /Reset) . 

8. WAIT <UNMASKED> <TRIGGER> 

Halt die Abarbeitung der Konf igurationsroutine an und 
wartet auf den Trigger <TRIGGER> . 1st <UNMASKED> 
gesetzt, wird auf das erwartete Trigger unabhangig des 
Zustandes der Trigger-Maske reagiert. 

9. TRIGGER <TRIGGER><CT#> 

Sendet den Binarwert eines Triggers an die iibergeordnete 
durch CT# adressierte CT. 

10. GETBUS/GETCTS 

Baut eine Verbindung zu dem Inter-CT-Bus auf. 

11 . LOOSEBUS/LOOSECTS 

Lost die Verbindung zum Inter-CT-Bus auf. 

12. REFERENCE <TRIGGER><ID> 

Schreibt in die LUTl bei Adresse <TRIGGER> den Wert 
<ID>, wodurch einem Triggersignal eine bestiirante KR 
zugeordnet wird. 

Die Befehle EXECUTE, LOAD, REMOVE, PUSH, MASK, WAIT, 
TRIGGER, REFERENCE sind nur innerhalb der Klammer BEGIN 
... STOP gultig. Auiierhalb dieser Klammer werden die 
Befehle nicht ausgefiihrt. 

Der Aufbau einer Konf igurationsroutine (KR) sieht wie 
folgt aus : 
BEGIN <ID>; 

giiltige Befehle 

• • • 

STOP; 
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Indirekte Addressierung (Referenzierung) 

Das Cache-Prinzip der CT ermoglicht das 

Zwischenspeichern einer KR in einer CT, wobei die KR von 
mehreren unterschiedlichen tieferliegenden CTs Oder CELs 
genutzt werden. 

Werden von den tieferliegenden Einheiten Zugriffe auf 
das externe Interface des Bausteines (z.B. RAM, 
Peripherie) durchgefiihrt , ergibt sich die Notwendigkeit 
unterschiedliche Adressen oder Teile des externen 
Interfaces zu speichern. Dadurch wurde sich der Inhalt 
der einzelnen benotigten KRs grundlegend unterscheiden . 
Ein Caching ist nicht mehr moglich. 
Abhilfe schafft eine indirekte Referenzierung. Dazu 
werden spezielle KR (im folgenden IKR genannt) 
verwendet, die die notwendigen externen Parameter 
beinhalten und setzen. Eventuell werden iiber Trigger 
andere unterschiedliche KRs in verschiedenen 
Hierarchieebenen aufgerufen. Ab Ende einer IKR wird das 
eigentliche KR aufrufen. Lediglich die IKR sind nicht 
cachebar, wahrend die aufgerufenen KR durchaus 
einheitlich und daher cachebar sind. Es ist sinnvoll, 
die Groiie der IKR auf das absolute Minimum zu 
reduzieren, namlich ausschlieiilich die externen und 
unterschiedlichen Parameter und den Aufruf der 
einheitlichen KR. 

Eine indirekte Konf igurationsroutine (IKR) ist wie folgt 
aufgebaut : 
BEGIN <ID>; 
... 

xxx; gultige Befehle, wobei lediglich externe Peripherie 

angesteuert werden sollte, 
TRIGGER <ID>; Start-, Stop- oder Lade-Anf orderungen an 

Periphere Prozesse 

GOTO <ID>; Sprung zur einheitlichen KR 
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STOP; 



Sonderfalle : 

1. WAIT_FOR__BOOT 

Dieses Kommando ist nur an der ersten Adresse des CTR 
giiltig. Wahrend des Boot-Vorganges wird zuachst die 
komplette Boot-KR in das CTR geschrieben, jedoch nicht 
die Beginnsequenz des Boot-KR BEGIN <0>. An dessen 
Stelle (auf Adresse 1) steht WAIT-FOR-BOpT, das bei 
einem RESET automatisch gesetzt wird. Erst nachdem die 
gesamte Boot-KR in das CTR geschrieben ist, wird 
WAIT_FOR_BOOT mit BEGIN <0> uberschrieben und die CTS 
beginnt mit der Abarbeitung der Boot-KR. 
WAIT_FOR_BOOT darf nicht innerhalb eines Programmes 
auftreten. 

2. BOOT <CT-ID> 

BOOT <CT-ID> kennzeichnet in welche CT die nachfolgende 
Boot-KR geschrieben werden soli. Nach BOOT <CT-ID> folgt 
kein BEGIN, die Boot-KR wird nciht durch STOP, sondern 
durch ein nachf olgendes BOOT <CT-ID> abgeschlossen . Ein 
STOP beendet den Bootvorgang. 

BOOT <CT-ID> darf nicht innerhalb eines Programmes 
auftreten. 

Boot-Vorgang 

Nach einem RESET ladt die CT des obersten Hierarchie- 
Levels (ROOT-CT) die Boot-KR in die CTs' der unteren 
Hierarchien. Dazu existiert ein Sprung an eine 
festgelegte Adresse (BOOT-ADR) im, der ROOT-CT 
zugeordneten, externen Konf igurationsspeicher (ECR) . Die 
ROOT-CT fiihrt diesen Sprung durch und erreicht die Boot- 
Sequenz. Diese ist wie folgt aufgebaut: 
BOOT <CT-IDO>; COMMAND; COMMAND; 
BOOT <CT-ID1>; COMMAND; COMMAND; ... 
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BOOT <CT-IDn>; COMMAND; COMMAND; ... 
STOP; 

Wahrend des Boot-Vorganges wird zunachst die koraplette 
Boot-KR in das CTR ab Adresse 2 der durch <CT-ID> 
angegebenen CT geschrieben. Die Beginnsequenz des Boot- 
KR (BEGIN <0>) wird nicht auf Adresse 1 geschrieben. An 
dessen Stelle steht WAIT-FOR-BOOT, das bei einem RESET 
automatisch gesetzt wird. Erst nachdem die gesamte Boot- 
KR in das CTR. geschrieben ist, und die ROOT-CT das 
nachste BOOT <CT-ID> erreicht hat, wird STOP an das Ende 
des Boot-KR in das CTR geschrieben und WAIT_FOR„BOOT mit 
BEGIN <0> liberschrieben. Die CTS beginnt mit der 
Abarbeitung der Boot-KR, 

Laden einer Konfigur at ions routine 

Es existierem drei Gundmechanismen urn eine 

Konf igurationsroutine, aulier der Boot-KR anzufordern: 

1. Ausfuhren eines LOAD <ID> durch die CTS 

2. Ausfuhren eines EXECUTE <ID> durch die CTS, wobei die 
KR mit der betreffenden ID nicht im CTR vorhanden ist. 

3. Auftreten eines Triggers, der uber die LUTl auf einen 
<ID> ubersetzt wird, dessen zugehorige KR nicht im CTR 
vorhanden ist. 

Der Ablauf in alien drei Fallen ist derselbe: 
Die ID der angef orderten KR wird der LUT2 als Adresse 
angegeben. Die LUT2 uberpriift, ob eine gultige Adresse 
im CTR existiert. Existiert diese nicht, d.h. <ID> zeigt 
in der LUT2 auf den Wert 0, wird load <ID> an die CTS 
gesendet . 

Die CTS fordert daraufhin die <ID> betreffende KR bei 
der hierarchisch ubergeordneten CT an. Diese Anforderung 
erreicht die ubergeordnete CT in Form eines Triggers und 
wird entsprechend von ihr ausgewertet . 

Die ubergeordnete CT sendet die angeforderte KR an die 
anfordernde CT. Die Daten werden ab der Adresse, auf die 
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der FREE-POINTER (FP) zeigt in das CTR geschrieben, 
wobei der FP nach jedem Schreibzugrif f um eins erhoht 
wird. 

Erreicht der FP die obere Grenze des CTR, wird der 
Garbage-Kollektor (GC) aufgerufen, um die unterste KR 
innerhalb des CTR zu entfernen und das CTR zu 
komprimieren . Der FP wird dabei neu gesetzt. Dieser 
Vorgang findet so lange statt, bis die zu ladende KR 
komplett in das CTR palit. 

Sprungtabelle im Konfigurationsspeicher 

Der der ROOT-CT zugeordnete Konfigurationsspeicher 
beinhaltet samtliche KR, die fur eine Applikation 
geladen werden miissen. Im externen 

Konfigurationsspeichers (ECR) befindet sich an einer 
festgelegten Adresse (ADR-BOOT) Sprung zu der Boot- 
Konf igurations-Routine . In einem weiteren festgelegten 
Speicherbereich (LUT~ECR) beliebiger, jedoch innerhalb 
einer Applikation fest vorgegebener Lange die Sprunge zu 
den einzelnen KRs . Dabei wird die <ID> der jeweiligen KR 
als Adresse im ECR verwendet, an der die Startadresse 
der jeweiligen KR steht; wodurch KRs indirekt adressiert 
werden: 

ID -> LUT-ECR -> KR 

Anderung der KR im Konfigurationsspeicher 

Die KR mit der ID <A> soil geandert werden. Zunachst 
schreibt der HOST die neue KR fur die ID <A> an eine 
freie Speicherstelle im ECR. Die ID <A> wird zusammen 
mit der neuen Adresse der KR im Konfigurationsspeicher 
von der ubergeordneten Einheit (HOST) in ein dafur 
vorgesehenes Register der ROOT-CT geschrieben. Die ROOT- 
CT sendet an alle darunterliegenden CTs das Kommando 
REMOVE <A>. Daraufhin entfernen alle CTs beim Erreichen 
eines STOP oder wahrend IDLE-Zyklen, also sobald keine 
KR ausgefuhrt wird, die auf diese ID bezogene KR aus dem 
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CTR und setzen die LUT2 an Adresse <A> auf "NoAdr", das 
bedeutet, es existiert keine giiltiger Adresseintrag fiir 
ID <A> in LUT2. Wird die ID <A> erneut angefordert, 
zwingt der fehlende Eintrag ("NoAdr") an Stella <A> in 
die LUT2 jede CT die KR <A> vom ECR neu anzufordern. 

Das FILMO 

Ein KR besteht hauptsachlich aus dem Befehl PUSH; der 
neue Konf igurationsworte an eine bestimmte Adresse 
schreibt. 1st das Schreiben eines Konf igurationswortes 
des Types KW nicht moglich, da das adressierte 
konfigurierbare Element (CEL) nicht bereit ist eine neue 
Konfiguration zu empfangen (REJECT) , wird das 
Konfigurationswort statt an das adressierte 
konfigurierbare Element (CEL) in einen Speicher, im 
folgenden FILMO genannt, geschrieben. Die nachfolgenden 
Befehle werden normal abgearbeitet , bis erneut ein 
Konfigurationswort nicht geschrieben werden kann, das 
dann in das FILMO geschrieben wird. 

Ist das Schreiben eines Konf igurationswortes des Types 
KWR nicht moglich, da das adressierte konfigurierbare 
Element (CEL) nicht bereit ist eine neue Konfiguration 
zu empfangen (REJECT) , wird das Konfigurationswort statt 
an das adressierte konfigurierbare Element (CEL) in 
einen Speicher, im folgenden FILMO genannt, geschrieben. 
Alle nachfolgenden Befehle bis zum Ende der KR werden 
nicht an die CEL, sondern direkt in das FILMO 
geschrieben. 

Das FILMO wird in IDLE-Zyklen und vor jedem Ausfiihren 
eines neuen KR komplett durchlaufen. Dabei wird, 
beginnend beim altesten Datenwort, entsprechend eines 
FIFOs nach dem Stand der Technik, jedes ausgelesene Wort • 
des FILMOs an sein adressiertes Element zu senden; dabei 
muii das adressierte Element bereit sein das 
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Konf igurationswort zu empfangen. Sofern die Datenworter 
von Beginn an geschrieben werden konnen (d.h. die 
adressierten konf igurierbaren Elemente (CELs) sind 
bereit) wird der Eintrag aus dem FILMO nach Art eines 
FIFOs entfernt. Kann ein Konf igurationswort nicht 
geschrieben werden, wird es iibersprungen und nicht aus 
dem FILMO entfernt. Im Gegensatz zu einem FIFO werden 
die Daten nach dem ubersprungenen Konf igurationswort 
weiter ausgeiesen. Konf igurationsworte, die nach einem 
ubersprungenen Konf igurationswort geschrieben werden 
konnen werden entweder je nach Implement ierung des 
FILMOs 

1. als geschrieben markiert und nicht aus dem FILMO 
geloscht, wobei als geschrieben markierte 
Konfigurationsworter bei den folgenden Durchlaufen nicht 
mehr gelesen werden, bzw. sofort geloscht werden, sofern 
kein iibersprungenes Konf igurationswort mehr vor ihnen 
liegt; 

Oder 

2. aus dem FILMO geloscht, wobei die 
Konfigurationsworter vor und nach dem geloschten 
Konfigurationswort erhalten bleiben, dabei miissen zum 
Loschen die nachf olgenden Worte nach vorne (oben) oder 
die davorliegenden Worte nach hinten (unten) geschoben 
werden, wobei die Reihenfolge der Konf igurationsworte 
unbedingt beibehalten wird, 

Wird eine neue KR ausgefuhrt, werden die 
Konf igurationsworte (KW) , die von der CTS nicht an die 
adressierten Elemente (CELs) geschrieben werden konnten, 
erneut an das FILMO angehangt, d.h. die KW werden an das 
Ende (aus Leserichtung) des FILMOs geschrieben. 1st das 
FILMO voll, d.h. es existieren keine freien Eintrage fur 
Konfigurationsworte, wird die Ausfiihrung des KR 
gestoppt. Das FILMO wird so lange durchlaufen, bis 
geniigend Konf igurationsworte geschrieben werden konnten 
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und entsprechend viele freie Eintrage entstanden sind, 
woraufhin das KR weiter abgearbeitet wird. 
Das FILMO stellt einen FIFO-ahnlichen Speicher dar, der 
immer vom altesten Eintrag an linear durchlaufen wird, 
im Gegensatz zu einem FIFO werden jedoch Eintrage 
iibersprungen (First In Linear Multiple Out) . 

Die Funktion der Konfigurationstabellen- 
St at emachine ( CTS ) 

Die Konfigurationstabellen-Statemachine (CTS) ubernimmt 
die Steuerung der CT. Dabei fiihrt sie die Befehle der KR 
aus und reagiert auf eingehende Trigger. Sie ubernimmt 
die Verwaltung des FILMOs, i,b. liest sie in IDLE-Zyklen 
und vor dem Ausfiihren einer KR das FILMO aus. 
Sie reagiert auf die von der LUT-Struktur generierten 
Signalen illegal <TRG> (Illegal Trigger, siehe Fig. 1, 
0102) und load <ID>. load <ID> wird generiert, wenn ein 
Cache-Miss in LUT2 vorliegt (0105), oder die durch ID 
referenzierte KR/IKR als geloscht markiert wurde (0107) . 
Sie reagiert auf die Steuersignale der ubergeordneten 
CT. 

Ein Implementationsbeispiel fiir die Verarbeitung der 
Befehle ist in den Figuren 2 bis 7 dargestellt. 

Steuersignale an ubergeordnete CTs 

- illegal <TRG>. (0102) 

Zeigt der ubergeordneten CT an, daii ein unbekannter 
Trigger <TRG> aufgetreten ist. 

- load <ID> (0105/0107) 

Fordert die ubergeordneten CT zum Laden der <ID> 

auf. 

- trigger <TRG> <CT#> (0108) 

Sendet einen Trigger <TRG> an die ubergeordnete 

Oder 

an die adressierte CT <CT#>. 
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Steuersignale von iibergeordneten CTs 

- rismove <ID> (siehe Fig. 15, 1513) 

Fordert die CT zum loschen der <ID> auf, 

- write_to_FP <data> (siehe Fig. 2, 0205) 

Sendet Daten an die CT. Die Daten werden an das 
Ende des belegten Speichers angehangt. 

Die Punktion des Garbage-Kollektors (GC) 

Der CTR unterliegt zwei Problemen: 

1. Verweist ein LOAD- oder EXECUTE-Bef ehls, bzw. ein 
Trigger, auf eine ID, deren KR nicht im CTR vorhanden 
ist, muJ^ die KR nachgeladen werden. U.U. ist jedoch 
nicht geniigend Platz im CTR vorhanden um die 
angeforderte KR zu laden. 

2. Beim Auftreten eines REMOVE <ID> ist die 
entsprechende KR aus dem CTR zu entfernen. Dabei 
entsteht, sofern sich die KR nicht am Ende des CTR 
befindet eine Lucke. Beim Laden einer neuen KR wird die 
Lucke U.U. nicht wieder ganz aufgefiallt oder die Lucke 
ist zu klein fiir die neue KR. Dies fuhrt zu einer 
Fragment ierung des CTR. Die Aufgabe des Garbage- 
Kollektor ist es, KR aus dem CTR zu entfernen, um Platz 
fiir neue Eintrage zu schaffen UND nach Entfernen der 
Eintrage den CTR so umzuorganisieren, dafj alle 
verbleibenden KR als geschlossener Block hintereinander 
im Speicher liegen und die f reigewordenen Speicherblocke 
als ein geschlossener Block an einem Ende des CTR 
liegen. 

Dadurch konnen auf optimale Weise und ohne Verluste an 
Speicherplatz neue KR nachgeladen werden. 



Auswerten von Triggerimpulsen 

Jede CT besitzt einen Anschlufi an mehrere zu ihrer 
jeweiligen Hierarchieebene gehorenden Triggersignale, 
die zu einem Bus zusammengef ai5t sind. Eingehende Trigger 
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werden iiber eine Maske ausgewertet, d.h. nur die 
freigeschalteten Triggersignale werden weitergeleitet . 
Die freigeschalteten Triggersignale werden taktsynchron 
in einem Sample-Register zwischengespeichert 
(gesampled) . Ein Arbiter wahlt eines der gespeicherten 
Triggersignale aus und wandelt das Signal in einen 
binaren Vektor, Das gewahlte Triggersignal wird aus den 
Sample-Register geloscht. Der Binarvektor wird an eine- 
erste Lookup-'Tabelie (LUTl) weitergeleitet, die den 
Binarvektor in die Identif ikationsnummer (ID) der 
auf zurufenden Konf igurationsroutine (KR) iibersetzt. 
Die ID wird in einer zweiten Lookup-Tabelle (LUT2) in 
die Adresse der KR im CT-Speicher (CTR) iibersetzt. Die 
CT-Statemachine (CTS) setzt ihren Programm-Pointer (PP) 
auf diese Adresse und beginnt mit der Ausfuhrung der KR. 
Voraussetzung ist, daib jeder iiber die Maske 
f reigeschaltete Trigger einen entsprechenden Eintrag in 
LUTl besitzt, Fehlt dieser, wird ein Fehlerzustand an 
die CTS weitergeleitet (illegal trigger), dabei wird 
jede ID = "NoAdr" als nicht vorhandener Eintrag 
gewertet. "NoAdr" ist ein implementationsabhangig 
gewahltes Token. 

Fehlt der Eintrag in LUT2, d.h. die auf die ID bezogene 
KR befindet sich nicht im CTR, wird eine Ladeanf orderung 
an die CTS gesendet (load <ID>) . 



Senden von Triggerimpulsen an die libergeordnete 
CT 

Neben der bereits beschriebenen Schnittstelle zu einer 
ubergeordneten CT zum Laden von KR existiert eine 
weitere Schnittstelle zum Austauschen von frei 
definierbaren Befehlen, insbesondere jedoch 
Triggervektoren. Dabei sendet eine CT 

- entweder an alle anderen CTs einen Befehl (BROADCAST) 
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- Oder an eine beliebige adressierte CT einen Befehl 
(ADDRESSED) 

Der Befehl "Triggervektor " stellt einen Binarwert dar, 
der auf einen Eintrag in der LUT2 der .empf angenden CT 
ref erenziert . 

Das Senden von Triggervektoren ist notwendig um 
beispielsweise innerhalb einer IKR eine KR in einer 
weiteren CT zu starten um beispielsweise die Peripherie 
Oder den Speicher anzusteuern. 

Zur Weiterleitung von Triggervektoren an eine 
ubergeordnete CT existieren 2 Mechanismen : 

1. Der LUTl wird ein Bit hinzugefugt, das angibt, ob der 
Inhalt des Speichers als KR ID oder als Binarwert fiir 
einen Triggerimpuls betrachtet wird. Liegt ein 
Triggerimpuls vor, wird der Dateninhalt von LUTl direkt 
als Trigger an die ubergeordnete CT gesendet. 

2. Mit dem Befehl TRIGGER kann der Binarwert eines 
Triggers angegeben werden, der direkt an die 
ubergeordnete CT gesendet wird. (Alternativ konnten 
statt einem Triggerwert auch direkt IDs iibertragen 
werden) • 

Zum Starten einer KR in einer fremden CT uber 
Triggervektoren muii zum Erreichen der Deadlockf reiheit 
ein Synchronisationsverfahren geschaffen werden. Das 
Verfahren muB beachten, daB lediglich eine KR innerhalb 
eines bestimmten Gruppe von CTs weitere KR auf anderen 
CTs innerhalb dieser Gruppe startet. Das Starten mehrere 
KR gleichzeitig kann zu einem Deadlock zwischen den CTs 
fuhren, ahnlich des bereits beschriebenen Deadlocks auf 
der CEL-Ebene. 

Das Grundprinzip eines solchen Verfahrens lauft wie 
folgt ab: 
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Ein KR ist wie folgt aufgebaut: 
» • • 

GETCTS/GETBUS 
TRIGGER <ID>, <CT#> 
TRIGGER <ID>, <CT#> 

LOOSECTS/LOOSEBUS 
• • • ■ 

Der Befehl "GETCTS" innerhalb einer KR einer CT 
(INITIATOR) zeigt an, dafS im folgenden Signale an andere 
CTs (TARGET) gesendet werden. Mit Trigger <ID>, <CT#> 
wird die ID einer zu startenden KR an die CT mit der 
eindeutigen ID CT# gesendet. Das Senden des Triggers 
geschieht dabei zunachst an die direkt iibergeordnete CT, 
die entsprechend der CT# den Trigger an eine wiederum 
untergeordnete CT innerhalb ihres CT-Raumes sendet Oder 
an die ihrerseits iibergeordnete CT (siehe CT- 
Hierarchien) . Erreicht der Befehl die TARGET quittiert 
diese den Empfang. 

Beim Durchlauf des Befehls durch eine CT wird eine 
Prioritatskennung des Befehls jeweils urn eines erhoht. 
Trifft die Weiterleitungsanf orderung eines Befehls auf 
eine weitere Anforderung innerhalb einer CT, wird der 
Befehl mit der niedersten Prioritat zuruckgewiesen . 
Dadurch wird 

a) sichergestellt, daii innerhalb eines iiberschneidenden 
Systemes nur ein Befehl zu einer Zeit ausgebreitet wird 
und dadurch auch nur eine KR gestartet wird, was zu der 
geforderten Deadlockf reiheit fiihrt, 

b) sichergestellt, daiJ der bislang am wenigsten weit 
ausgebreitete Befehl zuruckgewiesen wird, was zu einer 
Steigerung der Performance fuhren kann 

Nach Zuruckweisen eines Befehls, werden alle 
vorhergehenden Befehle innerhalb der GETCTS/LOOSECTS 
ebenfalls zuruckgewiesen, d.h. INITIATOR sendet an alle 
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TARGET das Signal DISMISS und die Ausfuhrung der KR 
startet nach einer Wartezeit bei GETCTS erneut. 
Die Quittierungen aller Trigger innerhalb eines 
Befehlsabschnittes GETCTS . . . LOOSECTS werden an die 
INITIATOR~CT gesendet . Bei jeder eintref f enden 
Quittierung wird die Verarbeitung des nachsten Befehls 
f ortgesetzt . 

Bei Erreichen des Befehls LOOSECTS sendet INITIATOR an 
alle TARGET das Signal GO. Dadurch starten die TARGET- 
CTs die Ausfuhrung der KR mit der von Trigger 
ubertragenen ID. 

TARGETS wechseln nach Auftreten eines Triggers in einen 
Zustand, in welchem sie auf das Auftreten eines GO oder 
DISMISS Signales warten. 

Aufgrund der besseren Implement ierbarkeit wird weiterhin 
ein leicht modif iziertes Verfahren vorgestellt: 
Zwischen den CTs einer Gruppe einer Hierarchieebene 
befindet sich ein Bussystem (Inter-CT-Bus) . Dieses 
Bussystem verbindet alle CTs der Gruppe und eine direkt 
der Gruppe iibergeordnete CT. 

Durch den Befehl GETBUS, der funktionell GETCTS ahnlich 
ist, wird das Bussystem von einer CT arbitriert. Die 
Befehle werden uber das Bussystem an die CTs derselben 
Gruppe weitergeleitet . Befindet sich die adressierte CT# 
nicht innerhalb der Gruppe, wird durch die iibergeordnete 
CT automatisch deren iibergeordneter Bus arbitriert und 
der Befehl weitergeleitet. Die arbitrierten Busse 
bleiben INITIATOR zugeordnet und somit fiir alle anderen 
CTs gesperrt, bis entweder eine Zuriickweisung erfolgt, 
Oder der Befehl LOOSEBUS den Bus auf lost . LOOSEBUS ist 
mit LOOSECTS vergleichbar . Vor Ausfuhren des Befehls 
LOOSEBUS wird das GO~Signales an alle betexligten Cts - 
gesendet. Dies erfolgt entweder durch den Befehl 
LOOSEBUS Oder einen speziellen vorgeschalteten Befehl. 
Befehle, i.b. Trigger werden ebenfalls gemaii des bereits 
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beschriebenen Grundverf ahrens verarbeitet. Eine 
Zuriickweisung erfolgt, wenn ein Bussystem nicht 
arbitriert werden kann. Beim Arbitrieren sind die CTs 
einer Ebene jeweils gleich priorisiert, die 
iibergeordnete CT besitzt eine hohere Prioritat. 
Beim Senden eines Befehls iiber den Inter-CT-Bus bleibt 
der Befehl so lange aktiv, bis die adressierte CT den 
Befehl akzeptiert (ACCEPT) oder zuriickweist (REJECT) . 

Der priorisierte Round-Robin-Arbiter 

Der priorisierte Round-Robin-Arbiter (Single-Cycle- 
Round-Robin-Arbiter SCRR-ARB) ist taktsynchron 
aufgebaut, d,h. bei jeder - je nach Implementierung 
positiven oder negativen - Taktflanke (TFl) liefert er 
ein Ergebnis. Die eingehenden Signale (ARB-IN) 
durchlaufen eine Maske (ARB-MASK) , die von dem Arbiter 
gemaib dem nachfolgend beschriebenen Verfahren selbst 
verwaltet wird. Die Ausgangssignale der Maske werden an 
einen Prioritatsarbiter (ARB-PRIO) nach dem Stand der 
Technik geleitet, Der Arbiter liefert taktsynchron bei 
jeder Taktflanke (TFl) ein Ergebnis (ARB-OUT), d.h. den 
Binarwert des hochstpriorisierten Signals nach der Maske 
(ARB-MASK) . Dem Ergebnis zugeordnet ist ein Signal 
(VALID), das angibt, ob der Binarwert giiltig oder 
ungultig ist. Abhangig von der Implementierung der 
Prioritatsarbiters ist es moglich, dali beim Anliegen des 
Signals 0 und beim Anliegen keines Signals derselbe 
Binarwert generiert wird: In diesem Fall zeigt VALID an, 
daB das Ergebnis ungultig ist, sofern kein Signal 
anliegt. Dieses Signal wird 
1- als Ergebnis der Arbiters ausgegeben 
und 

2. auf einen Dekoder geschaltet, der die Binarwerte - ' 
wie in der folgenden Tabelle beispielsweise fiir einen 3- • 
bit Binarwert angeben - auskodiert . (Das 
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Kodierungsverfahren ist gemali dieses Prinzips auf jeden 
beliebigen Binarwert anpafSbar) : 



Binarwert 
(ARB— OUT) 


Auskodierung 
(ARB-DEC) 


Berne rkung . 


111 


0111 1111 




110 


0011 1111 




101 


0001 1111 




100 


0000 1111 




Oil 


0000 0111 




010 


0000 0011 




001 


0000 0001 




000 


1111 1111 


Reset-Zustand und 

wenn Binarwert (ARB-OUT) ungialtig 



Dem Dekoder zugeordnet ist ein Register (ARB-REG) , das 

die auskodierten Werte (ARB-DEC) des Dekoders bei der z 

TFl inversen Taktflanke (TF2) ubernimmt . ARB-DEC wird 

auf die Maske (ARB-MASK) zuriickgekoppelt und schaltet 

die einzelnen Eingangssignale (ARB-IN) frei. 

Der funktionale Ablauf im Arbiter ist wie f olgt : 

1. Nach einem RESET sind alle ARB-IN iiber ARB-MASK 
freigeschaltet, da ARB-DEC alle Signale auf 
"Freigabe" stellt. 

2. Das hSchst priorisierte gesetzte ARB-IN 
(beispielsweise besitzt in der obigen Tabelle das 

Signal 7 (binar 111) die hochste PrioritSt und 0 
(binar 000) die niederste Prioritat) wird als 

Binarwert ausgegeben. 

3. iiber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. 

4. Die folgenden Schritte 5 und 6 wiederholen sich so 
lange, bis das Signal 0 (binar 000) erreicht ist, 
Oder kein Signal hinter ARB-MASK mehr anliegt. Dann 
schaltet ARB-DEC (siehe Auskodierungstabelle) wieder 
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alle Signale durch ARB-MASK iiber ARB-DEC frei und der 
Ablauf beginnt bei Schritt 2. 

5. Das nunmehr hochst priorisierte gesetzte ARB-IN wird 
als Binarwert ausgegeben. 

6. iiber ARB-DEC wird das Signal gesperrt, sowie alle 
weiteren Eingange die evtl. noch hoher priorisiert 
waren, aber nicht gesetzt sind. (Weiter mit Schritt 
4) 

Dadurch wird erreicht, dafi alle Eingangssignale 
gleichberechtigt behandelt werden und bei jedem 
Taktzyklus eines der Eingangssignale (ARB-IN) binar 
auskodiert und ausgegeben (ARB-OUT) wird. 
ARB-REG kann mit einem Enable-Eingang (EN) versehen 
werden, der eine Anderung des Registerinhaltes nur bei 
TF2 zulalJt, wenn ein entsprechendes Signal anliegt. 
Dadurch wird nicht bei jedem Takt ein Binarvektor 
ausgegeben, sondern abhangig von einer Freischaltung 
durch EN und TF2 . Der Eingang wird zur Synchronisation 
notwendig, wenn die nachgeordnete Schaltung die 
Verarbeitung nicht in einem Taktzyklus durchfuhren kann, 
sondern mehrere Zyklen benotigt und erst dann den 
nachsten Binarvektor akzeptiert. 

Unter Umstanden ist es sinnvoll eine Reihe von Signalen 
durch den Arbiter als hoher priorisiert anzusehen, 
wahrend die Mehrzahl der Signale gleichpriorisiert ist. 
Dies ist z.B. bei dem vorhergehend beschriebenen 
Verfahren zur Weiterleitung von Signalen zwischen CTs 
notwendig. Urn ein Signal hoher zu priorisieren, wird der 
hochstpriorisierte AnschluB des ARB-PRIO nicht maskiert, 
d.h. an der Maske (ARB-MASK) vorbeigeleitet . Dadurch 
wird das Signal bevorzugt behandelt. 

Aufbau einer CT auf Basis eines Mikrokontrollers 

Abweichend von den bisherigen Beschreibungen kann eine 
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CT auch in einer Mikrokontrollerarchitektur 
implement iert werden. 

Es ist leicht einsehbar, dali die Grundf unktionen, wie 
Triggersteuerung, Lookup-Tabelle LUTl und LUT2, sowie 
die Inter-CT-Kommunikation und das Schreiben der KW an 
die CEL ohne weiteres auch von einem Mikrokontroller 
ausgefiihrt werden konnen. Lediglich der Aufbau eines 
effizienten FILMOs stellt ein Problem dar, das sich vor 
allem in der erreichbaren Performance bemerkbar macht . 
Daher wird auf den Aufbau des FILMOs gesondert 
eingegangen. 

Aufbau des FILMOs 

Der FILMO ist nicht als separater Speicher ausgestaltet . 
Vielmehr ist der gewohnliche Prograramspeicher urn die 
FILMO-Funktionalitat erweitert. Dazu wird ein 
zusatzliches Bit (FILMO-BIT) jedem KW zugeordnet, das 
anzeigt, ob das entsprechende KW in die CEL geschrieben 
wurde oder nicht. Ist FILMO-BIT gesetzt, wird das 
entsprechende KW nicht ausgefiihrt. Beim Schreiben eines 
Kws in den Speicher wird das FILMO-BIT zuriickgesetzt . 
Alle KRs innerhalb einer CT werden tiber eine Verkettete- 
Liste (FILMO-LIST) in der Reihenfolge miteinander 
verbunden, wie sie durch Trigger oder LOAD<ID> 
aufgerufen wurden . Eine KR bleibt so lange in der FILMO- 
LIST, bis sie komplett ausgefiihrt wurde, dann wird sie 
aus der Liste entfernt. Die FILMO-LIST wird entsprechend 
des FILMO-Verfahrens durchlaufen und stellt damit einen 
direkten Ersatz fiir den FILMO-Speicher dar. 
(Der Vollstandigkeit halber sei angemerkt, daB entgegen 
des ursprunglichen FILMO-Verfahrens keine KR zweimal in 
der Liste vorkommen kann. Wird eine KR aufgerufen, die 
noch in der FILMO-LIST steht, muB deren Ausfuhrung so • 
lange verzogert werden, bis sie aus der FILMO-LIST 
entfernt wurde. ) 
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Der Aufbau einer FILMO-Speicherstelle ist wie f olgt : 



FILMO-BIT KW 



Befehle 

Der Mikrokontroller unterstiitzt die folgenden Befehle, 
die direkten EinfluB auf das FILMO haben: 
PUSH Schreiben eines KW an eine CEL 

PUSHSF Schreiben eines KW an eine CEL und setzen des 
FILMO-BITs, wenn das KW angenommen 

(ACCEPT) wurde 

PUSHRET Schreiben eines KW an eine CEL und Riicksprung 
(RETURN) aus der Unterroutine, wenn das KW 
nicht von der CEL angenommen wurde (REJECT) . 
Dieser Befehl wird verwendet, wenn 
nachfolgende KW in der KR von der 
Konf iguration dieses KWs (ACCEPT) abhangig 
sind; durch den Riicksprung aus dem KR wird 
deren Konf iguration so lange verhindert, bis 
PUSHRET erfolgreich (ACCEPT) ist. 
Schreiben eines KW an eine CEL, nur dann, wenn 
zuvor innerhalb der KR kein REJECT auftrat. 
Dient ahnlich wie PUSHRET dazu, Abhangigkeiten 
in der Konf igurationsreihenfolge von KWs zu 
handhaben . 



PUSHNR 



Garbage Kollektor 

Entsprechend der bisherigen Beschreibung wird ein 
Garbage-Kollektor (GC) zum Entfernen von nicht mehr 
benotigten KRs benutzt. Der GC lauft an, wenn' entweder 
der Platz zum Laden einer neuen KR im Speicher nicht 
mehr ausreicht und IDs entfernt werden miissen; Oder eine 
KR explizit durch den Befehl REMOVE - mit der Angabe der 
ID der zu loschenden KR - geloscht wird. 
Urn den GC-Lauf moglichst einfach zu gestalten, werden 
samtliche KRs uber eine verkettete Liste miteinander 
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verbunden. GC lauft die Liste durch und entfernt die 
nicht mehr benQtigten KR, indem sie von anderen KR 
iiberschrieben und die Listeneintrage entsprechend 
angepaI5t werden. Dabei werden die alle verbleibenden KR 
im Speicher so verschoben, daB die durch die zu 
loschenden KR entstehende Speicherlucke geschlossen wird 
und am Ende des Speichers ein groBerer zusaminenhangender 
Freiraum entsteht. 

Aufbau einer KR 

Ein moglicher Grundaufbau einer KR ist in der folgenden 
Tabelle dargestellt: 

jmp START; 

length 

garbage - previous 
garbage - next 

FILMO - previous 
FILMO - NEXT 

CACHE - statistic 

KR - statistic 

START : 



ret; 



Zu Beginn der KR erfolgt ein Sprung iiber den folgenden 
Header hinweg zum Start der Befehlssequenzen. Es folgt 
die doppelt verkettete Liste fur den Garbage-Kollektor, 
in der samtliche KR miteinander verbunden sind. 
"length" gibt die Lange der KR an. Diese Information 
kann fur Block-Move-Bef ehle nach dem Stand der Technik 
verwendet werden, die Anwendung finden, wenn die KR im 
Speicher bewegt werden miissen (Garbage, Load, etc.). 
In der anschlieBenden doppelt verketteten Liste ist der 
FILMO aufgebaut, wobei nur die KRs miteinander verbunden . 
sind, die KWs enthalten, die noch nicht an die GEL 
geschrieben wurden. 
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Es folgt eine Statistik liber das Cache-Verhalten, die 
beispielsweise die Anzahl der Aufrufe der KR (pro Aufruf 
wird der Wert urn 1 erhoht) , das Alter (anhand der Anzahl 
der GC~Laufe uber die KR mefibar: pro GC-Lauf wird der 
Wert um 1 erhoht) , etc. enthalt. Diese Statistik kann 
der GC auswerten, wenn aus Speicherplatzgrunden eine KR 
entfernt werden muii. Fur das Cachen ergeben sich durch 
solche Statistiken erhebliche Vorteile. So kann 
beispielsweise abhangig vom verwendeten Cache- 
Algorithmus, entsprechend den Anf orderungen der 
Applikation, der Mikrokontroller so programmiert werden, 
da& 

1. die alteste/neueste KR 

2. die kleinste/grSlite KR (s. Eintrag "length") 

3. die am seltensten/am haufigsten aufgerufene KR 
aus dem Cache geloscht wird, wenn freier Speicher 
benotigt wird. Dabei konnen selbstverstandliche weitere 
sinnvolle Statusinf ormationen gespeichert werden. Bin 
derart selektives Cachen ist bei heute bekannten Cache- 
Strukturen nicht moglich. Insbesondere werden frei 
progranunierbare Cachealgorithmen in Caches nach dem 
Stand der Technik nicht unterstutzt. 

Abschlielbend ist eine KR-Statistik vorhanden, die 
beispielsweise die Anzahl der noch nicht konf igurierten 
(REJECT) Oder der konf igurierten (ACCEPT) KWs enthalt. 
Gleichzeitig kann die Adresse des ersten noch zu 
konf igurierten KW gespeichert werden. Dies hat den 
Vorteil, dalJ bei einem FILMO-Durchlauf direkt auf das KW 
gesprungen werden kann und nicht das komplette KR 
durchlaufen werden muG>, was zu einer erheblichen 
Performancesteigerung fiihrt. 

Abschlieftend sei zu den KR angemerkt, daS> die 
verketteten Liste vorzugsweise durch Eintrag der 
Vorganger/Nachfolger-ID aufgebaut werden, da damit die 
absoluten Speicheradressen ohne Probleme vom GC 
verschoben werden konnen. Innerhalb einer KR sollten nur 



39 



wo 99/44147 



PCT/DE99/00504 



relative Spriinge anstatt absoluter Spriinge verwendet 
werden, um Probleme beim Laden der KR und bei GC-Laufen 
zu vermeiden, da sich die absolute Adressen dabei 
verandern. 

Der Vollstandigkeit halber soli noch erwahnt werden, dafi 
gemali dem bereits beschriebenen Prinzip auch beim 
Einsatz eines Mikrokontrollers vor dem Ausfiihren einer 
neuen KR (aufgrund eines Triggers oder Befehls, auch von 
einer anderen CT aus) der FILMO durchlaufen wird und vor 
Durchlauf des FILMOs der Zustand der CEL 
(umkonfigurierbar oder nicht) gesichert wird. 

Figuren 

Die nachfolgend beschriebenen Figuren verdeutlichen 
anhand eines Implementationsbeispiels die Verwaltung von 
Konf igurationsdaten nach dem vorgestellten Verfahren: 

Figur 1 : Verfahren der Adressgenerierung innerhalb der 
Lookup-Tabellen 

Figur 2-7 Abarbeitung der Befehle und Funktion der 
Statemachinen 

Figur 8: Aufbau des SCRR-ARB 
Figur 9: Aufbau der LUTl & LUT2 

Figur 10: Aufbau der Pointerarithmetik und des CTR 

Figur 11: Aufbau eines FILMO 

Figur 12a: Hierarchische Anordnung der CTs 

Figur 12b: Senden eines Triggers zwischen den CTs 

Figur 12c, d: Methoden zum Senden eines 

Figur 13: Aufruf einer KR durch mehrere IKR 

Figur 14: Aufbau der LUTl einer ROOT-CT 

Figur 15: Aufbau der HOST-Steuerung einer ROOT-CT 

Figur 16: Verdeutlichung des LUT und ECR Konzeptes 

Figur 17: Ablauf steuerung einer CT mittlerer 

Hierarchieebene, bzw. einer ROOT-CT 
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Figur 18: Deadlockproblematik bei der Konf iguration 

eines 2-dimensionalen Arrays (siehe Patentbeschreibung) 

Figur 19: Verdeutlichung des FILMO-Konzeptes 

Figur 20: Grundprinzip der Inter-CT-Konimunikation 

Figur 21: Implemetierungsbeispiel der Inter-CT- 

Kommunikation nach dem GETCTS-Verfahren 

Figur 22: Implemetierungsbeispiel der Inter-CT- 

Kommunikation nach dem GETBUS-Verf ahren 

Figur 23: Busstruktur des Inter-CT-Bus 

Figur 24: Adressierung innerhalb von CT-Hierarchien 

Figur 25: GARBAGE-Liste 

Figur 26: FILMO-Liste 

Figur 27: FILMO Funktion innerhalb einer KR 

Figur 28: Speichern der Zustande vor Ausfiihren einer KR 

Oder des FILMOs. 

Beschreibung der Figur en 

Figur 1 zeigt den Ablauf der CTR-Adressgenerierung 
innerhalb einer CT. Dabei wird ein eingehender binarer 
Triggervektor (0101) in der LUTl auf eine giiltige KR 
Oder IKR ID ubersetzt, Existiert keine gultige ID, wird 
ein Signal "Illegal Trigger" generiert (0102), das 
anzeigt, daB der Trigger nicht in LUTl bekannt ist. Das 
Signal kann als Fehlermeldung an die iibergeordnete CT 
weitergeleitet Oder ignoriert werden. Die Ubersetzung 
von "Trigger" nach "ID" wird mittels des Befehls 
"REFERENCE" in die LUTl eingetragen. 

Eine gultige ID (0103) wird an die LUT2 weitergeleitet. 
IDs' die innerhalb von Befehlen, also durch einen 
Operanden, angegeben sind (0104), treffen direkt auf die 
LUT2. Die LUT2 ubersetzt eine eingehende ID in die 
Adresse der KR/IKR innerhalb des CTR. Ist die KR/IKR 
nicht im CTR gespeichert (es liegt im Cache nicht vor) , 
wird das Signal "Miss" generiert (0105) . Ist die 
ubersetzte Adresse der KR/IKR mit dem Token "NoAdr" 
markiert, wird mit "NoEntry" (0107) angezeigt, daB die 
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Adresse geloscht ist. "Miss" und "NoEntry" zeigen an, 
dafi eine Ubersetzung auf eine CTR-interne Adresse nicht 
moglich ist. Auf Grundlage dieses Signals ladt die LOAD- 
Statemachine die KR/IKR mit der entsprechenden ID von 
einer daruberliegenden CT nach. 

Sofern eine giiltige Adresse vorhanden ist, wird diese an 
die Pointerarithmetik des Adressgenerators 
weitergeleitet (0106) . In LUTl wird ein eingehender 
binarer Trigg.ervektor entweder in eine ID oder einen 
weiteren Triggervektor ubersetzt, wobei in diesem Fall 
der Triggervektor ausgegeben wird (0108) . 

In Figur 2 ist der Ablauf beim Laden einer KR/IKR 
dargestellt. Zunachst wird die ID (0201) der zu ladenden 
KR/IKR an die dariiberliegende CT gesendet. Daraufhin 
wird in die LUT2 an der Stelle des Eintrages fur die 
angeforderte ID der Wert des FreePointers (FP) 
eingetragen. FP zeigt auf den Eintrag hinter dem letzten 
fiir eine KR/IKR genutzen Eintrag im CTR. Dies ist der 
erste Eintrag, auf den die zu ladende KR/IKR gespeichert 
wird. 

Die Statemachine wartet auf ein Datenwort von der 
druberliegenden CT. Sobald das Wort verfugbar ist, wird 
es an die durch FP ref erenzierte Stelle geschrieben. FP 
wird inkrementiert. Zeigt FP auf einen Eintrag hinter 
dem Ende des CTR wird der erste Eintrag im CTR entfernt 
urn Platz zu schaffen (0202); dabei wird FP aktualisiert . 
Ist das von der dariiberliegenen CT gesendete Datenwort 
"STOP", wird der Ladevorgang abgebrochen (0203), 
ansonsten mit dem Warten auf ein neues Datenwort 
fortgesetzt (0204) . 

In Figur 3a ist der "MASK"-Bef ehl dargestellt. Der 
Operand des Befehls wird in das MASK-Register 
geschrieben. Das MASK-Register befindet sich am Eingang 
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der Triggersignale vor LUTl und maskiert ungultige 
Trigger aus. 

In Pigur 3b wird durch den Befehl "TRIGGER" der Operand 
des Befehls als Triggervektor zu den anderen CTs 
abgesendet . 

In Figur 3c wird durch den Befehl "REFERENCE" die 
Ubersetzung eines Triggers zu der entsprechenden KR/IKR 
ID in die LUTl geschrieben, 

In Figur 4a wir der Befehl "WAIT" dargestellt. Der 
Operand des Befehls wird in das WAITMASK-Register 
geschrieben. Alle Trigger, bis auf den/die Erwarteten 
und daher in WAITMASK f reigeschalteten werden ignoriert. 
Erst nach Auftreten des Triggers wird zum Programmf luJi 
zuruckgekehrt . 

In Figur 4b ist der "PUSH"-Bef ehl abgebildet. Das 

Konf igurationswort wird zum adressierten 
konf igurierbaren Element (CEL) gesendet. Akzeptiert das 
CEL das Konf igurationswort nicht; da das CEL sich 
beispielsweise im Zustand "nicht konf igurierbar " 
befindet; wird das Konf igurationswort in den FILMO 
geschrieben (0401) . 

Figur 5 zeigt den Ablauf eines "REMOVE"-Befehles . Es 
gibt zwei Auf rufvarianten : 

1. Die erste im CTR liegende KR/IKR wird aus dem CTR 
entfernt. Dem GarbagePointer (GP) wird die Adresse 0 des 
CTR zugewiesen (0501) . 

2. Eine spezifisch durch ihre ID angegebene KR/IKR wird 
aus dem CTR entfernt. Dem GarbagePointer (GP) wird die 
erste Adresse des zu entfernenden KR/IKR im CTR 
zugewiesen (0502) . 

Der MovePointer wird mit dem Wert von GP geladen. GP und 
MP referenzieren auf einen "BEGIN <ID>"-"Bef ehl im CTR, 
auch wenn die erste KR/IKR aus dem CTR entfernt werden 
soli. Die betreffende ID wird in LUT2 als ungultig 
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markiert, MP wird so lange inkrementiert, bis das "BEGIN 
<ID>" des nachsten im Speicher liegenden KR/IKR erreicht 
wird (0503), ODER MP gleich dem FreePointer (FP) ist, 
das bedeutet, daJi die zu entfernende KR/IKR die letzte 
im CTR ist (0504) . 

- In diesem Fall wird FP mit dem Wert von GP geladen, 
wodurch die durch die zu ioschende KR/IKR belegten 
Speicherstellen als frei markiert werden; und die 
Funktion "REMOVE" ist beendet (0505) . 

- Andernfalls ("BEGIN <ID>" wird erreicht (0506)) werden 
die durch MP referenzierten Daten an die durch GP 
referenzierte Speicherstelle kopiert. MP und GP werden 
inkremetiert . Dieser Ablauf findet so lange statt, bis 
MP das Ende von CTR oder die Position von FP erreicht 
hat (0507) . Wird wahrend des Ablauf es durch MP eine 
Speicherstelle ref erenziert , in der "BEGIN <ID>" steht, 
wird der Eintrag fur die entsprechende ID in LUT2 mit MP 
uberschrieben (0508), damit bei einem Lookup die 
richtige Speicherstelle ausgegeben wird. 

Figur 6 zeigt das Ablauf diagram des FILMOs. Ein FILMO 
beinhaltet drei Pointer: 

1. WriteP: Der Schreibzeiger des FILMO-RAM 

2. ReadP: Der Lesezeiger des FILMO-RAM 

3. FullP: Der Zustandszeiger , der den "Fiillstand" des 
FILMO-RAMs reprasentiert und einen Unterlauf, bzw. 
Uberlauf verhindert. 

Ein ein-Bit Register "BeginF" zeigt an, ob sich der 
aktuelle Lesezugriff am Anfang des FILMO-RAMs befindet 
(TRUE), d.h. keine nicht geloschten Eintrage befinden 
sich zwischen dem Lesezeiger und dem Beginn des FILMO- 
RAMs; Oder sich der Lesezeiger in der Mitte des FILMO- 
RAMS befindet (FALSE), also benutzte Eintrage zwischen- 
dem Lesezeiger und dem Beginn des FILMO-RAMS liegen. 
Weiterhin existieren zwei Register zum Speichern der 
Zustande des ReadP und FullP. Es" ist notwendig beim 
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Auftreten des ersten ungeloschten Eintrages die beiden 
Register zu sichern, da bei einem spater stattf indenden 
Lesezugriff an der Stelle dieses Eintrages mit dem 
Auslesen begonnen werden muJi. Andererseits miissen jedoch 
ReadP und FullP wahrend des aktuellen Lesevorganges 
weiterhin modifiziert werden, urn die nachsten 
Leseadressen zu erhalten, bzw. das Ende des FILMO-RAMs 
festzustellen. Durch den Aufbau des FILMOs als FIFO- 

ahnliche Struktur als sogenannten Ringspeicher 

kann Beginn und Ende des Speichers nicht anhand einer 
Adresse 0 oder eine Maximaladresse festgelegt werden. 
Aus dem Grundzustand fuhren zwei Ablaufpfade: 
1. Lesepfad (0601) 

FullP und ReadP werden in die Register gesichert. 
Die Abarbeitungsschleife beginnt: 
BeginF ist TRUE. 

1st FullP gleich 0, werden ReadP und FullP aus ihren 
Registern zuruckgelesen (0602) und die Statemachine 
springt in den Grundzustand zuruck. 

Ansonsten (0603) wird getestet, ob der Eintrag im FILMO, 
auf den ReadP zeigt gleich "NOP" ist, d.h. es handelt 
sich um einen als geloscht markierten Eintrag in der 
Mitte des FILMOs. Ist dies nicht der Fall (0604) wird 
versucht den Eintrag in das konf igurierbare Element 
(CEL) zu schreiben. Gelingt dies nicht (REJECT, 0605), 
da CEL nicht umkonf igurierbar ist, wird BeginF auf FALSE 
gesetzt, FullP dekrementiert und ReadP inkrementiert • 
Die Statemachine springt an den Beginn der 
Abarbeitungsschleife (0606) . 

Gelingt das Schreiben des Eintrages an das CEL (0607), 
Oder der Eintrag ist ein NOP, wird BeginF gestestet : 
BeginF == TRUE (0608) : Es liegen keine ungeloschten 
Eintrage vor diesem, FullP wird inkrementiert , ReadP 
wird in dem zugeordneten Register gesichert, um den 
neuen Anfang des FILMOs f estzuhalten . FullP wird 
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gesichert urn die aktuelle Datenmenge f estzuhalten; ReadP 
wird inkrementiert . 

BeginF == FALSE (0609) : FullP wird inkrementiert und der 
aktuelle Eintrag im FILMO-RAM mit NOP uberschrieben, 
d,h. der Eintrag wird geloscht. ReadP wird 
inkrementiert . 

In beiden Fallen springt die Statemachine an den Beginn 
der Abarbeitungsschleif e . 
2. Schreibpfad (0610) 

Es wird getestet, ob der FILMO-RAM voll ist, indem FullP 
auf den maximalen Wert uberpruft wird. 1st dies der Fall 
(0611), wird in den Lesepfad gesprungen urn Platz zu 
schaf fen. 

Ansonsten wird das Datenwort in den FILMO-RAM 
geschrieben und WriteP und FullP inkrementiert. 

Figur 7 zeigt den Ablauf in der Hauptstatemachine . Der 
Grundzustand (IDLE) wird verlassen, sobald ein 

1. REMOVE-Kommando von der dariiberliegenden CT auftritt 
(0701) : Der REMOVE -Befehl wird ausgefuhrt und die 
Statemachine kehrt nach IDLE zuriick. 

2. Ein Triggersignal zur Generierung eines Triggers 
zwischen den CTs auftritt (0702) : 

Der Trigger wird ausgegeben. 

Die Statemachine springt in den "STOP"-Bef ehl und danach 
nach IDLE zuruck. 

3. Ein Triggersignal zur Ausfuhrung eines KR/IKR <ID> 
auftritt (0703) : 

Der ProgramPointer (PP) wird mit der durch LUT2 
generierten Adresse geladen. 1st die Adresse ungiiltig, 
d.h. kein Eintrag fiir das zu ladende KR/IKR vorhanden, 
wird dieses geladen (0704) und PP neu gesetzt. 
Die Ausfuhrungsschleife beginnt: 

PP wird inkrementiert (beim ersten Schleif endurchlauf 
wird dadurch der BEGIN <ID>-Befehl ubersprungen) , das 
Auftreten weiterer Trigger wird unterbunden, RECONFIG 
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wird gesperrt. Die Befehle werden ausgefiihrt und zum 
Beginn der Ausfuhrungsschleife gesprungen (0707) . 
Der Befehl "STOP" wird gesondert ausgefiihrt (0705) . Die 
Trigger und RECONFIG werden wieder f reigeschaltet und 
die Statemachine springt nach IDLE. 

Der Befehl "EXECUTE" wird ebenfalls gesondert ausgefiihrt 
(0706) . Die in EXECUTE <ID> angegebene ID wird in das 
ID-REG geschrieben. PP wird neu geladen und die durch ID 
angegebene KR/IKR ausgefiihrt (0708) . 

Nach einem Reset der CT wird die Grundkonf iguration in 
das CTR geladen und direkt in die Ausfiihrung der 
Grundkonfiguration gesprungen (0709) . 

Figur 8 zeigt den Aufbau eines SCRR-ARB. Die zu 
arbitrierenden Signale gelangen uber Datain auf eine 
Maske (0801), die gemaiS der bekannten Tabelle einen 
zusammenhangenden Teil der Signale durchschaltet , bzw. 
sperrt. Ein gewohnlicher Prioritatsarbiter (0802) nach 
dem Stand der Technik arbitriert ein Signal aus der 
Menge der Durchgeschalteten und lieferte dessen 
Binarvektor (BinaryOut) zusammen mit einer 
giiltig/ungiiltig-Kennung (ValidOut) (ebenfalls gemalb dem 
Stand der Technik) als Ausgang des SCRR-ARB. 
Dieses Signal wird gemafi der bekannten Tabelle dekodiert 

(0803) und auf ein Register zur Takt synchronisierung 

(0804) gefiihrt. Uber dieses Register wird die Datain 
Maske geschaltet. Dabei wird das Register entweder durch 
einen Takt oder ein Next-Signal (Enable EN) , das den 
nachsten giiltigen Binarvektor abfragt gesteuert, Bei 
einem Reset oder wenn die Kennung (ValidOut) ungiiltig 
anzeigt wird das Register so geschaltet, daB die Datain 
Maske alle Signale durchschaltet . 

Der Aufbau der Maske ist in 0805 dargestellt. In 0806 
ist die Maske ein weiteres Mai abgebildet, dabei sind 
die Signale Datain 0.. Datain 1 gemaB des SCRR-Prinzips 
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gleichpriorisiert, wahrend Datain m . . Datain n 
hoherpriorisiert sind • 

In Pigur 9 ist die LUT-Struktur abgebildet. Der 
Binarvektor (Binaryin) des arbitrierten Triggers wird 
auf den Adresseingang der LUTl (0901) gefuhrt. 
LUTl ubersetzt den Binarvektor entweder in einen 
giiltigen Trigger um diesen an eine andere CT 
weiterzuleiten oder eine gultige ID. Beide werden iiber 
0910 ausgegeben. 0911 zeigt an, ob es sich um einen 
Trigger oder eine ID handelt, 

1st liber den Befehl "REFERENCE" keine Ubersetzung des 

eingehenden Binarvektors in LUTl eingetragen, wird 

mittels eines Biteintrages oder eines Vergleichers auf 

ein bestimmtes Token (z.B. "VOID") das Signal 

"Illegal Trigger" 0914 generiert. 

Ein Trigger wird iiber 0912 an externe CTs gefuhrt, IDs 
werden iiber den Multiplexer (0902) weiterverarbeitet • 
0902 schaltet entweder der Datenausgang von LUTl, der 
eine gultige ID angibt, oder das ID-Register (0903) der 
CT auf den Adresseingang der LUT2 (0904). 0904 besitzt 
eine Cache-ahnliche Struktur, d.h. der niederwertige 
Teil (0906) des Datenausgangs von 0902 wird auf den 
Adresseingang von 0904 geschaltet, wahrend der 
hoherwertige Teil (0907) auf den Dateneingang von 0904 
geschaltet wird. Der 0907 gehdrende Datenausgang wird 
iiber einen Komparator (0905) mit 0907 verglichen. Der 
Vorteil dieses Verfahrens ist, dafi 0904 nicht die Tiefe 
2ur Ubersetzung aller IDs aufweisen muli, sondern 
erheblich kleiner ausf alien kann. Ahnlich eines 
gewohnlichen Caches wird lediglich ein Teil der IDs 
ubersetzt, wobei in der LUT2 anhand 0907 festgestellt 
werden kann, ob die selektierte ID der von LUTl 
angegebenen entspricht. Dies entspricht einem Cache/TAG- 
Verfahren nach dem Stand der Technik. 
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Einem zweiten Dateneingang von 0904 ist ein Multiplexer 

0908 zugeordnet, der je nach Operation den FreePointer 
(FP, Operation LOAD), den GarbagePointer (GP, Operation 
REMOVE) Oder eine Invalid-Kennung/Token (NoAdr, 
Operation REMOVE) zur Speicherung an LUT2 liefert. Die 
beiden Pointer ref erenzieren auf Speicherstellen im CTR, 
"NoAdr" gibt an, dali kein Eintrag zu der passenden ID 
existiert, der Eintrag geloscht wurde. Dies wird am 
Datenausgang f estgestellt , indem uber den Vergleicher 

0909 die Oaten auf das Token "NoAdr" verglichen werden. 
An die Statemachine wird weitergeleitet : 

~ Das Auftreten eines Binarvektors wird iiber "Validin" 
(vgl. Figur 8) . 

- Die Angabe ob es sich bei der Ubersetzung in LUTl urn 
einen Trigger oder eine ID handelt (0911, "Trigger/ID 
Out"). Trigger werden uber 0912 an andere CTs 

weitergeleitet, IDs werden in der eigenen CT 
abgearbeitet und an die LUT2 weitergeleitet. 
~ Das Ergebnis von 0905, das angibt, ob die 
entsprechende ID in 0904 gespeichert ist ("Hit/Miss 
Out") . 

- Das Ergebnis von 0909, das angibt, ob die 
entsprechende ID auf eine giiltige Adresse im CTR zeigt 
("NoEntry Out") , 

Die von 0904 generierte Adresse wird an das CTR 
weitergeleitet ("CTR Address Out"). 

Die LUTl wird uber den Befehl "REFERENCE" mit der 
Ubersetzung des eingehenden Binarvektors auf einen 
Trigger oder ID geladen. Die Operanden des Befehls 
werden iiber den Bus 0913 an die LUTl gefOhrt. iiber 
denselben Bus wird das ID-Register (0909) geladen. 

Figur 10 zeigt die Pointerarithmetik des GarbagePointer 
(PG) , ProgramPointer (PP) , MovePointer (MP) und 
FreePointer (FP) . Jeder Pointer besteht aus einem 
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getrennt ansteuerbaren ladbaren up/down-Zahler . Jeder 

zahler kann sofern notwendig mit dem Wert jedes 

anderen Zahlers geladen warden; ebenso wie mit der 

Ausgabe von LUT2 (1007) . 

Uber Vergleicher wird festgestellt ob 

1. PP gleich MP 

2. MP gleich FP 

3. FP gleich der maximalen Position im CTR 
ist. Die Ergebnisse werden zur Steuerung der 
Statemachines verwendet . 

Uber einen Multiplexer (1001) wird einer der Pointer zum 
Adresseingang des CTR geleitet. Die Daten geiangen iiber 
einen Multiplexer (1002) entweder von der ubergeordneten 
CT (1005) Oder aus einem Register (1003) an das CTR. Zur 
Statemachine und zum FILMO (1006) werden uber einen 
Multiplexer (1004) entweder die Daten von der 
ubergeordneten CT oder des CTR weitergeleitet . Dabei 
wird beim Auftreten eines REMOVE-Bef ehls von der 
ubergeordneten CT der direkt uber 1004 an die 
Statemachine geleitet, wahrend ansonsten die Befehle aus 
dem CTR an die Statemachine gefuhrt werden. Das Register 
1003 dient zur Speicherung und Riickkopplung von Befehlen 
auf den CTR Eingang, die wahrend eines Durchlaufs des 
Garbage-Kollektors von einer Adresse an eine andere 
geschoben werden. 

Der Aufbau eines FILMOs ist in Figur 11 dargestellt. Die 
Daten geiangen von dem CTR (1101) in das FILMO und 
werden entwerder uber den Multiplexer (1102) in das 
FILMO-RAM (1103) geschrieben oder liber den Multiplexer 

(1104) an die konf igruierbaren Elemente (1116) gesendet. 
Werden Daten in 1103 geloscht, wird uber 1102 eine 

"NOP "-Token nach 1103 geschrieben. Uber den Vergleicher 

(1105) am Datenausgang wird das "NOP"-Token erkannt und 
ein Schreiben zu den konf igurierbaren Elementen 
verhindert. Uber den Multiplexer 1106 wird entweder der 
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Schreibzeiger WriteP (1107) oder der Lesezeiger (1108) 
an den Adresseingang von 1103 gefiihrt. In dem Register 
1109 wird der Lesezeiger gesichert urn ein Rticksetzen 
(siehe Figur 6) zu ermoglichen. 

Der Fiillstandszahler Full (1110) von 1103 wird gemaJS 
Figur 6 in dem Register 1111 zum Riicksetzen gespeichert . 
Zwei Vergleicher testen, ob 1103 leer (1112) Oder voll 
(1113) ist. Uber den Multiplexer 1115 wird selektiert, 
ob die Steuersignaie der Statemachine (von 1101) oder 
des FILMOs an 1116 gesendet wird. 

Figur 12a zeigt den hierarchischen Aufbau der CTs. Alle 
CTs beziehen ihre Daten aus der ROOT-CT (1201) und dem 
ihr zugeordneten ECR (1204) . Fur jede 

Implementierungsebene in einem Baustein existiert eine 
Oder mehrere CTs. Jede CT ist fur die Verwaltung ihrer 
Ebene und der darunterliegenden CTs zustandig. Es ist 
nicht notwendig, daii alle Aste das Baumes gleich tief 
sind. Beispielsweise konnen weniger Ebenen zur Steuerung 
der Peripherie (1202) eines Bausteines existieren als 
zur Steuerung der Arbeitseinheiten (1203) . Der 
Datentransfer erfolgt baumartig. Jede CT arbeitet als 
Cache fur alle unter ihr liegenden CTs, 
Figur 12b zeigt den Triggerflufi zwischen den CTs. 
Wahrend der Datenflul^ baumartig verlauft, ist der 
Triggerfiuli nicht f estgelegt . Jede CT kann an jede 
andere einen Trigger senden. Fur gewohnlich findet ein 
Triggeraustausch nur von den Blattern (1203) in Richtung 
der ROOT-CT (1201) statt . Unter Umstanden kann der 
Transfer jedoch auch in die entgegengesetzte Richtung 
verlaufen. 

In Figur 12c ist ein Triggervektor Broadcast 
dargestellt, wobei 1205 einen Triggervektor an alle CTs 
sendet . 
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Figur 12d zeigt einen HIGHER-Triggervektor, den 1206 an 
die uber ihr liegende CT sendet. 1207 sendet einen 
LOWER-Triggervektor an alle unter ihr liegenden CTs. 
1208 iibertragt einen direkt adressierten (ADDRESSED) - 
Triggervektor an eine bestinunte CT, die nicht direkt mit 
1207 verbunden ist. 

In Figur 13 fordern zwei unabhangige IKR n und m eine 
gemeinsame, in der daruberliegenden CT gecachte KRx an. 
Es ist angedeutet, daJ5 diese KR von dem gesamten Ast 
gecachet wird und auch in einem Nachbarast (1301) uber 
eine gemeinsame CT verfugbar ist. 

Figur 14 zeigt ein gegenuber Figur 9 modif iziertes LUT- 
System, das in ROOT-CTs und CTs mittlerer 
Hierarchieebenen verwendet wird, Der grundlegende 
Unterschied zu den bislang beschriebenen CTs ist, daB 
anstatt einzelner Triggersignale ID- und/oder Trigger- 
Vektoren von der CT verwaltet werden mussen. Jedem 
Vektor ist dabei ein Handshake-Signal (RDY) zur Anzeige 
der Gultigkeit des Vektors zugeordnet, die an einen 
Arbiter (1401) geleitet werden. Uber die Multiplexer 
(1402, 1403) wird entweder einer der Triggervektoren 
(1404) Oder einer der ID-Vektoren (1405) ausgewahlt. 
Triggervektoren gelangen direkt auf den Adresseingang 
der LUTl (1406), die ansonsten gemafS Figur 9 beschaltet 
ist. Das ID-Register (1407) ist ebenfalls gemali Figur 9 
beschaltet. Im Gegensatz zu Figur 9 besitzt der 
Multiplexer 1408 drei Eingange (vgl. 0902). Der 
Multiplexer wird dabei auiier von der Statemachine 
zusatzlich von dem Arbiter 1401 angesteuert . Uber den 
zusatzlichen Eingang werden ID-Vektoren iiber 1403 direkt 
an die LUT2 weitergeleitet . Dazu dient der Bus 1409. 
(Prinzipiell konnen auch bei CTs gemali Figur 9 IDs gemaB 
einem Multiplexer (1408) direkt auf die LUT2 geschaltet 
werden. Die IDs konnen dann ohne Ubersetzung direkt von 
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den CEL an die LUT2 gesendet werden.) "Trigger/ID Out" 
wird gemaB Figur 9 generiert. Ein "Validin" Signal, das 
gemali Figur 9 auf ein "Valid Out" weitergeleitet wird 
existiert nicht. Statt dessen wird je nach Arbitrierung 
durch 1401 ein "Valid Trigger Out" fur Triggervektoren 
und ein "Valid ID Out" fiir ID-Vektoren generiert, um die 
Statemachine anzuweisen, wie die Verarbeitung 
stattzuf inden hat. 

Der Bus 1409 wird iiber 1410 an eine weitere Einheit 
geleitet, die nur in der ROOT~CT existiert und in Figur 
15 beschrieben ist. 

Eine ROOT-CT benotigt zusatzlich zu den normalen CT- 
Funktionen ein Interface zu dem externen 
Konf igurationsspeicher (ECR) , sowie den erf orderlichen 
Adressgenerator und Einheiten zum Verwalten der Zugriffe 
auf den ECR, 

Eine gewohnliche CT iibersetzt in LUTl eingehende 
Triggervektoren auf einen ID und in LUT2 das ID auf eine 
Speicherstelle im CTR (siehe Figur 16a) . Eine ROOT-CT 
Iibersetzt bei Zugriffen auf das ECR eine ID innerhalb 
des ECR auf eine Adresse im ECR, an der das durch ID 
referenziert KR/IKR beginnt, Dazu ist ein 
Speicherbereich im ECR festgelegt, dessen Grofie der 
moglichen Anzahl an IDs entspricht (ist beispielsweise 
eine ID 10-bit breit, ergibt das 2^° = 1024 mogliche IDs, 
also werden 1024 Eintrage im ECR reserviert) . In den 
folgenden Beispielen befindet sich dieser 
Speicherbereich am unteren Ende des ECRs und wird LUT- 
ECR genannt, um die Ahnlichkeit zur LUT2 zu 
unterstreichen. Die Ubersetzung eines Triggers auf eine 
ID findet dabei gemSJi den bereits bekannten CTs in der 
LUTl statt (1601) . Zum besseren Verstandnis verdeutlicht 
Figur 16b den Zugriff auf das ECR. 
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Eine ID gelangt in Figur 15 uber den Bus 1410 auf Figur 
14 an den Multiplexer 1501. Cber 1501 wird die ID in den 
ladbaren Zahler 1502 geschrieben. Der Ausgang von 1502 
fiihrt iiber einen Multiplexer 1503 an den Adressbus 
(1504) des ECR. Cber den Datenbus 1505 gelangt die 
Ubersetzung der ID auf eine Speicheradresse iiber einen 
Multiplexer/ Demultiplexer (1506) an 1501, der 1502 mit 
der Speicheradresse ladt. Daraufhin werden iiber die 
Statemachine LOAD-ECR (siehe Figur 17) die Datenworter 
der entsprechenden KR/IKR aus dem ECR gelesen und in das 
CTR geschrieben, wobei 1502 nach jedem Lesevorgang 
erhSht wird; so lange, bis der Befehl "STOP" gelesen 
wurde . 

Uber das Interface 1507 schreibt der iibergeordnete HOST 
iiber 1503/1506 die KR/IKR in das ECR. Dabei wird iiber 
die Statemachine (CTS) arbitriert, ob der HOST oder die 
ROOT-CT Zugriff auf das ECR hat. 

Nach einem Reset des Bausteines mufi eine 
Grundkonfiguration (BOOT-KR) geladen werden. Dazu wird 
eine feste Speicheradresse (BOOT-ADR) eingefvihrt, die 
auf die erste Speicherstelle der BOOT-KR zeigt . Als 
BOOT-ADR wird die Speicherstelle Oh empfohlen, sofern 
die IDs bei 1 beginnen, andernfalls kann 2'° oder irgend 
eine andere Speicherstelle verwendet werden. In dem 
Ausfuhrungsbeispiel wird 2"> verwendet. 

Die ROOT-CT fiihrt zum Laden der BOOT-KR an der Stelle 
BOOT-ADR einen Lookup durch, sofern eine BOOT-KR geladen 
ist. Die ROOT-CT schreibt die Daten nach 1502 um von 
dort die BOOT-KR bis zum Auftreten eines "STOP" Befehls 
zu laden. 

Eine iiberwachungseinheit innerhalb der ROOT-CT iibernimmt 



54 



wo 99/44147 



PCT/DE99/00504 



die Synchronisation des HOST mit dem Baustein. Dies 
geschieht folgendermafien: 

Die Adressen kleine 2^° werden durch 1508 uberwacht, d.h. 
bei Zugriffen auf diese Adressen durch den HOST wird ein 
Signal (ACC-ID) an die Statemachine (CTS) gesendet. 
Ebenfalls wird BOOT-ADR uber 1509 uberwacht und sendet 
ein Signal ACC-BOOT an die Statemachine (CTS) . 
Die Statemachine (CTS) reagiert wie folgt: 

- Schreibt HOST auf die BOOT-ADR, bewirkt dies das Laden 
der BOOT-KR. 

- Schreibt HOST das Datenwort 0 (1512) auf die BOOT-ADR, 
wird dies iiber den Komparator 1510 festgestellt und 
bewirkt das Anhalten des Bausteines. 

- schreibt der HOST auf eine Adresse kleiner 2'° wird die 
Adresse in das REMOVE-Register (1511) geladen. Da die 
Adresse der ID entspricht (siehe ECR-LUT) steht die ID 
der geanderten KR/IKR in 1511. An alle CTs wird der 
Befehl REMOVE <ID> zur sofortigen Ausfiihrung gesendet 
(1513) . Die CTs loschen daraufhin die KR/IKR der 
entsprechenden ID aus ihrem CTR, bzw. LUT2 . Bei einem 
nachfolgenden Aufruf der KR/IKR miissen die CTs 
zwangslaufig die neue KR/IKR aus dem ECR laden. 

Figur 17 zeigt den Ablauf in einer ROOT-CT bei Laden 
einer KR/IKR aus dem ECR. Befindet sich eine ID nicht im 
internen CTR (vgl. Figur 1, 1701) wird die ID in den 
Zahler 1502 geschrieben (1703) . Ein Zugriff auf das ECR 
mit der Adresse in 1502 liefert die Basisadresse der 
KR/IKR. Diese wird in 1502 geschrieben (1704) . Ein LOAD 
gemafi Figur 2 findet statt (1702) . Dabei werden die 
Daten statt von einer Ubergeordneten CT aus dem ECR 
gelesen (1705) und nicht nur in das eigene CTR 
geschrieben, sondern an die untergeordnete CT gesendet 
(1706) . 
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In einer CT mittlerer Hierarchieebene lauft die 
Ubersetzung der Trigger ahnlich Figur 1, mit der 
Ausnahme, daB Triggervektoren und ID-Vektoren gemal5 
Figur 14 behandelt werden. Die KR/IKR werden gemaii Figur 
2 geladen, mit der Ausnahme, dafl die Datenworte nicht 
nur in das eigene CTR geschrieben werden (0210), sondern 
gleichzeitig an die untergeordnete CT gesendet werden. 

Figur 19 verdeutlicht das FILMO Prinzip. Der FILMO 
(1901) wird bei lesenden und schreibenden Zugriffen 
immer vom Anfang zum Ende durchlaufen (1902) . Werden 
Eintrage vom Anfang des FILMOs geschrieben und geloscht 
(1903), wird der Lesezeiger auf den ersten ungeloschten 
Eintrag verschoben (1904) . Werden Eintrage aus der Mitte 
das FILMOs geschrieben (1905), bleibt der Lesezeiger 
unverandert (1906), die Eintrage werden mit "NOP" 
markiert (1907) . Werden Daten in das FILMO geschrieben 
(1908), werden diese am Ende, hinter dem letzten Eintrag 
angehangt (1909) . Der Lesezeiger (1910) bleibt 
unverandert . 

Selbstverstandlich kann eine CT mit nur einem Speicher, 
der LUTl, LUT2 und CTR umfaftt aufgebaut werden. Die 
Steuerung dafur ist jedoch aufwendiger. Die CTs sind 
dabei ahnlich der ROOT-CT aufgebaut, die bereits die 
LUT2 UND das CTR im ECR integriert . Fur das Verstandnis 
des Verfahrens ist eine Beschreibung dieser CTs nicht 
erforderlich. 

Wird eine CT als Cachesystem fur Daten eingesetzt, 
werden Trigger zum Schreiben von Daten in das CTR 
eingefuhrt, Dabei werden die Daten von einer CEL in das 
CTR geschrieben. Die hierzu notwendigen Anderungen sind 
trivial, das FILMO kann komplett entfallen. 
Beim Cachen der Daten tritt das Problem der 
Datenkonsistenz auf. Dies kann umgangen werden, indem 
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ein Verfahren gemali DE 42 21 278 Al eingesetzt wird, um 
die Daten und deren Giiltigkeit in den einzelnen 
Hierarchieebenen zu kennzeichnen. Werden Daten zur 
Durchfuhrung eines Read-Modify-Write-Zyklusses (RMW- 
Zyklus) angefordert, werden die Daten auf alien 
Hierarchieebenen anhand eines zusatzlichen Eintrages in 
dem CTR/ECR als "ungiiltig" (INVALID) gekennzeichnet . In 
den Eintrag kann dazu die eindeutige ID der die Daten 
benutzenden KR/IKR eingetragen werden. Die Daten konnen 
so lange von keiner KR/IKR mit anderer ID benutzt 
werden, bis die die Daten benutzende KR/IKR die Daten 
zurUckgeschrieben (vgl. Write-Back-Methode nach dem 
Stand der Technik) und ihre ID geloscht hat. 

Figur 20 zeigt ein Ausfuhrungsbeispiel : 
In Figur 20a fordert die CT 2007 Daten von der 
dariiberliegenden CT an, diese fordert die Daten von der 
ROOT-CT 2004; mit der Datenanf orderung wird die ID der 
Anfordernden KR/IKR (2001) iibertragen. Die Daten (2002) 
werden an 2007 gesendet. Alle anderen, spateren Zugriffe 
werden abgewiesen (2003) . 

In Figur 20b werden die Daten zuruckgeschrieben (2005), 
anderen, spateren Zugriffe werden wieder akzeptiert 
(2006) . 

In Figur 20c werden Daten von einer CT mittleren 
Hierarchie angefordert, im Besitz der Daten ist und 
diese an 2007 sendet . Die ID zum Sperren der Daten wird 
an alle CTs in der Hierarchie gesendet (2001) . Beim 
Riickschreiben der Daten (Write-Back) in Figur 20d werden 
die Daten an alle CTs in der Hierarchie geschrieben und 
die ID geloscht. 

Figur 21 zeigt die Kommunikation einer INITIATOR CT 
(2101) iiber mehrere Zwischen-CTs (2104, 2105, 2106) mit 
einer TARGET CT (2102), sowie die direkte Kommunikation 
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ohne Zwischenebenen mit einer TARGET CT (2103) nach dem 
GETCTS/LOOSECTS-Verf ahren . . 

2101 baut eine Verbindung zu 2103 auf . Nach 
erfolgreichen Aufbau erhalt 2101 von 2103 einen GRANT 
als Bestatigung des Auf baus . Danach baut 2101 iiber 2104, 
2105, 2106 die Verbindung zu 2102 auf. Die Verbindung zu 

2102 wird erst bestatigt (GRANT), wenn 2102 erreicht 
ist . 

1st die Verbindung nicht aufbaubar, da einer der Busse 
belegt ist, wird ein REJECT an 2101 gesendet und 2101 
bricht den Vorgang ab. Das bedeutet, dafi auch die 
Verbindung zu 2103 abgebrochen wird und ein REJECT an 

2103 gesendet wird. 

Bestatigt 2102 jedoch die Verbindung mit GRANT, sendet 

2101 an 2103 und 2102 eine GO-Befehl, urn gleichzeitig 
2103 und 2102 den gelungenen Busaufbau und die 
Synchonisation zu bestatigen. Durch dieses Protokoll 
sind Daten oder Befehle synchron und deadlockfrei 
iibertragbar, da iiber GO sichergestellt ist, dali alle 
TARGET die Befehle korreJct empfangen. 

Figur 22 zeigt den Ablauf der Inter-CT-Kommunikation 
nach dem GETBUS/LOOSEBUS-Verf ahren . Wahrend im Verf ahren 
gem. Fig. 21 die jeweils ubergeordneten CTs die 
steuernde und priorisierende Aufgabe besitzen, wird die 
Steuerung hier von den Inter-CT~Bussen (2201) 
ubernoramen. 

Eine Verbindung zu 2103 wird aufgebaut, indem die 
INITIATOR-CT (2101) ihren lokalen Inter-CT-Bus anfordert 
(2202) . Anforderungen werden bestatigt, wenn der Bus 
frei ist (ACCEPT) oder zuriickgewiesen, wenn der Bus 
belegt ist (REJECT) . Danach sendet sie die Adresse von 

2102 auf den Bus. GemaB dem Adressierungsschema erkennt 
die Bussysteuerung, daJ5 die Adresse aulierhalb der 
lokalen Busadressen liegt und baut uber die 
libergeordnete CT 2104 eine Verbindung zu deren lokalem 
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Bus auf (2203) . Da die Adresse von 2102 in dessen 
Adressbereich liegt, wird iiber 210 6 die Verbindung zum 
lokalen Bus von 2102 aufgebaut (2204). Da 2101 nunmehr 
alleiniger Busmaster samtlicher fiir die 
Datenkonununikation erf orderlicher Busse ist, ist 
sichergestellt, dal5 eine reibungslose deadlockf reie 
Kommunikation ablauft, da die Kommunikationskanale fiir 
alle anderen CTs gesperrt sind. Auch 2102 und 2103 
konnen die Busse nicht benutzen, da diese in ihrer 
TARGET-Rolle nur Befehle empfangen konnen und nur auf 
Anforderung durch den INITIATOR (2101) selbst Daten 
senden konnen. 

Sobald die Kommunikation beendet ist, werden die Busse 
durch ein Signal von 2101 abgebaut. 

Trifft 2101 wahrend des Busaufbaus auf einen benutzten 
Bus, wird ein REJECT an 2101 gesendet und 2101 baut die 
Bussysteme wieder ab und versucht den Aufbau zu einem 
spateren Zeitpunkt erneut . Forderen mehrere CTs 
gleichzeitig denselben Bus an, so ist die uberliegende 
CT hoher priorisiert (2205) . Darait wird vermieden, dali 
ein weit fortgeschrittener Busaufbau, der bereits iiber 
mehrere Ebenen lauft von einem noch sehr lokalen 
Busaufbau abgebrochen wird. 

Durch ein erweitertes Protokoll ist es moglich im Falle 
eines REJECTS nur die Busse abzubauen, die von dem hoher 
priorisierten Busaufbau benotigt werden. Dies kann zu 
einer erheblichen Perf ormancesteigerung fiihren, da nicht 
alle Busse zu einem spateren Zeitpunkt neu aufgebaut 
werden miissen. 



Der Aufbau des Inter-CT-Busses fiir das Verfahren gem. 
Fig. 22 ist in Pigur 23 dargestellt. Die CTs 2301-2304 
sind iiber ihre Interface (2308-2311) zusammen mit der • 
iibergeordneten CT 2305 (Interface 2307) an den Inter-CT- 
Bus 2312 angeschlossen. Die Aufschaltung auf den Inter- 
CT-Bus geschieht iiber einen Round-Robin-Arbiter, der 
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2308-2311 gleich priorisiert und 2307 hoher priorisiert, 
der einen Multiplexer zum Zusammenschalten der Busse 
ansteuert (2306) . Dem Arbiter zugeordnet ist ein 
Statemachine, die die Steuersignale (z.B. Auf/Abbau, 
ACCEPT, REJECT...) auswertet . 

Figur 24 zeigt den Aufbau des Adresschemas eines 
eindimensionalen CT-Baumes. Die Rechtecke symbolisieren 
eine CT. Dabei ist die Adresse der CT eingetragen. - 
kennzeichnet unrelevante Adressbits, die nicht 
ausgewertet werden, die relevanten Adressbits sind mit 
binarer 0 oder 1 angegeben, * steht fur jedes beliebige 
Adressbit. Es ist leicht nachvollziehbar, daS> durch 
Projektion dieses Schema auf mehrdimensionale Baume 
ebenso angewendet werden kann, dabei stellen die 
angegebenen Adressen jeweils eine der Achsen dar; mit 
anderen Worten, pro Achse existiert ein entsprechendes 
separates Adressystem. 

Figur 24a zeigt die Adressierung von CT 0001 aus. Dabei 
ist die relative Adresse -1 angegeben. Durch die 
Berechnung -1+1 = 00 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf . aktueller Ebene"), kann die CT 0000 
berechnet werden, die auf denselben lokalen Bus 
geschaltet ist. 

In Figur 24b ruft die CT 0010 die relative Adresse +10 
auf. Die Berechnung 10+0 = 10 ("relative Bewegung" + 
"Adresse der INITIATOR-CT auf aktueller Ebene") ergibt 
den Ubertrag 1, da der Adressbereich des niedersten 
lokalen Busses genau ein Bit breit ist. Dadurch wird der 
nachst hohere Bus selektiert. Dessen Adressberechnung 
ergibt mit 10+10 = 100 ("relative Bewegung" + "Adresse 
der INITIATOR-CT auf aktueller Ebene") erneut einen 
Ubertrag, da dessen Adressbereich mit 2 Bit um genau 
eins groJier ist, als der Adressbereich des niedersten 
Busses. Auf der nachsthoheren Ebene tritt bei der 
Berechnung 10 + 010 = 0100 kein Ubertrag auf, sodali das 
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3. Bit (von links) den Pfad 1** mit der nachst tieferen 
Ebene adressiert, das 2. Bit (von links) den Pfad 10* 
der wiederum nachst niedersten Ebene adressiert. und 
schliefilich das letzte Bit die TARGET-CT selektiert. 
Figur 24c zeigt das bekannt Verfahren uber 2 Ebenen in 
positive Richtung und Figur 24d zeigt das Verfahren iiber 
drei Ebenen in negativer Richtung mit negativem 
Uberlauf . 

Figur 25 zeigt den Aufbau eines 2-diniensionalen CT- 
Baumes. Auf der untersten Ebene (2502) befinden sich 2- 
dimensional angeordnet die CTs (2501) . Die Adresse der 
Dimension ist mit x/y in der jeweiligen CT angegeben. 
2502 iibergeordnet ist die nachsthohere Ebene (2504) , 
Deren CTs (2503) steuern jeweils eine Gruppe von 4 CTs 
der Ebene 2502. Der Adressraum der CTs auf 2504 ist um 
ein Bit weiter, * kennzeichnet die Adressbits der Ebene 
2502, die fiir die Selektion der CTs auf 2504 irrelevant 
sind, 2504 iibergeordnet befindet sich die ROOT-CT 2505. 
Deren Adresse ist wiederum um ein Bit welter, die 
Bedeutung von * ist Equivalent . 

Figur 26 zeigt die Verkettung des Garbage-Kollektors bei 
der Mikrokontroller-Implementierung. Dabei sind 
samtliche KRs miteinander iiber die Headereintrage 
(garbage-previous/garbage-next) miteinander verkettet . 
Beim Durchlaufen des Garbage-Kollektors durch die Liste, 
wird das Alter der KR durch Erhohen des Eintrages um 
(+1) fur die Cache-Statistik (2602) protokolliert . Der 
Garbage-Kollektor achtet auf den Eintrag KR-Statistik 
(2601), der anzeigt, ob die KR noch in der FILMO-Liste 
hangt. In diesem Fall darf die KR nicht von GC geloscht 
werden, da sie noch unkonf igurierte KW enthalt. 
Alternativ konnte dieser Test auch uber die Eintrage 
FILMO-next und FILMO-previous ablaufen. 
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In Figur 27 ist die Verkettung der FILMO-Liste 
dargestellt . 

Dabei kann die Verkettung eine vollkoinmen andere als in 
der Garbage-Liste (Fig. 26) sein. Die KRs sind iiber 
FILMO-previous und FILMO-next verkettet. Die Eintrage 
KR-Statistik (2701) zeigen auf das jeweils erste noch 
nicht konf igurierte KW in der jeweiligen KR. Ein FILMO- 
Lauf gestaltet sich derart, dafi> in der ersten ID die KR 
gestartet wird. Nach Ausfuhrung wird die Position des 
nicht ausgefuhrten KW nach 2701 geschrieben. Sollte KR 
komplett ausgefuhrt worden sein, wird das KR aus der 
verketteten FILMO-Liste entfernt, verbleibt aber im 
Speicher, Danach wird iiber die FILMO-Liste zu dem 
nachsten KR gesprungen, das ebenso verarbeitet wird. 

Figur 28 verdeutlicht den Aufbau einer KR bei 
Mikrokontrollersteuerung. Zu Beginn steht ein 
Sprungbefehl, der hinter den Header (2801) der KR 
springt. Jedem KW zugeordnet ist das FILMO-Bit (2802). 
Eine 1 (2803) zeigt an, daJ5 das KW von den CEL 
akzeptiert wurde (ACCEPT) und beim nachsten Durchlauf 
nicht mehr ausgefuhrt wird. Eine 0 (2804) zeigt einen 
REJECT an, das KW muli beim nachsten Durchlauf erneut 
ausgefuhrt werden. Die optionale KR-Statistik (2701) 
zeigt auf das erste mit 0 gekennzeichente KW. Erhalt 
PUSHRET (2805) einen REJECT, wird die Abarbeitung des KR 
hier abgebrochen und beim nachsten Durchlauf entweder 
beim ersten KW oder an der Stelle auf die 2701 zeigt neu 
aufgesetzt. Ansonsten wird das KR an dessen Ende bei 
2806 ordentlich verlassen. 

Figur 29 zeigt die Schaltung zum Sichern der 
Statusinformationen einer CEL vpr dem Durchlaufen des 
FILMOs Oder Starten einer KR. Die Statusinf ormation 
gelangt aus der CEL (2901) auf ein Register (2902). Vor 
dem Durchlaufen des FILMOs oder Starten einer KR sendet 
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die CT ein Freigabesignal (2903) an 2902. Daraufhin wird 
die Statusinformation ubernommen und an die CT 
weitergeleitet (2904) . 2904 bleibt konstant bis zum 
nachsten Absenden von 2903. 
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Begriffsdefinition 

ACCEPT Signal, das anzeigt, daU die adressierte CEL 
sich in einem konfigurierbaren Zustand befindet und das 
gesendete KW annimmt. 

Block-Befehle (u. a. BLOCK-MOVE) Befehle, die eine 
Mehrzahl von Daten (einen Block) im Speicher oder 
zwischen Speicher und Peripherie verschieben. Dabei wird 
die Herkunftsadresse der zu verschiebenden Daten, die 
Zieladresse der Daten und die Lange das Datenblocks 
angeben . 

Broadcast Senden einer Information an eine Vielzahl 

von Empfangern. 

Datenempfanger Die Einheit(en), die Ergebnisse der 

CEL weiterverarbeitetZ-arbeiten 

Datensender Die Einheit{en), die Daten fur die CEL 
als Operanden zur Verfiigung stellt/stellen 

Datenwort Ein Datenwort besteht aus einer beliebig 

langen Bit-Reihe, Diese Bit-Reihe stellt eine 
Verarbeitungseinheit fiir eine Anlage dar. In einem 
Datenwort konnen sowohl Befehle fiir Prozessoren o.a. 
Bausteine sowie rein Daten kodiert werden. 

Deadlock Zustand, indem aufgrund gegenseitiger 

Blockade keinerlei Datenverarbeitung moglich ist. 

DFP Datenflufiprozessor nach Patent/Of fenlegung DE 

44 16 881 

DPGA Dynamisch konf igurierbare FPGAs . Stand der 

Technik 
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Elemente Sanunelbegrif f fur alle Arten von in sich 

abgeschlossenen Einheiten, welche als Stiick in einem 
elektronischen Baustein zum Einsatz koiranen konnen. 
Elemente sind also: 

- Konfigurierbare Zellen aller Art 

- Cluster 

- RAM-Blocke 

- Logik 

- Rechenwerke 

- Register 

- Multiplexer 

- I/O Pins eines Chips 

Ereignis Ein Ereignis kann durch ein 

Hardwareelement in irgendeiner zur Anwendung passenden 
Art und Weise ausgewertet werden und als Reaktion auf 
diese Auswertung eine bedingte Aktion auslosen. 
Ereignisse sind somit zum Beispiel: 

- Taktzyklus einer Rechenanlage . 

- internes oder externes Interrupt-Signal . 

- Trigger-Signal von anderen Elementen innerhalb des 
Bausteines . 

- Vergleich eines Datenstroms und/oder eines 
Befehlstroms mit einem Wert. 

- Input/Output Ereigenisse. 

- Ablaufen, liberlaufen, neusetzen etc. eines Zahlers . 

- Auswerten eines Vergleichs. 

FIFO First-In, First-Out Speicher nach dem Stand 

der Technik 

FILMO Abgewandeltes FIFO, aus dem linear Daten 
gelesen werden. Eine Beschrankung des Lesezeigers auf 
den Beginn des Speichers ist nicht vorhanden. 
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FPGA Programmierbarer Logikbaustein . Stand der 

Technik. 

F-PLUREG Register in dem die Funktion der CEL gesetzt 
wird. Ebenfalls wird der OneShot- und Sleep-Mode 
gesetzt. Das Register wird von der PLU beschrieben. 

Fragmentierung Zerteilen von Speicher in eine 

Vielzahl oftmals kleiner und damit nutzloser 
Speicherbereiche . 

Garbage-Kollektor Einheit zum Verwalten des Speichers. 
Verhindert eine Fragmentierung. 

H-Pegel Logisch 1 Pegel, abhangig von der verwendeten 
Technologie 

HOST Einem Baustein Oder Baugruppe iibergeordneter 

Rechner . 

IDLE-Zyklus Zyklus, in dem eine Statemachine keine 
Verarbeitung durchfiihrt. Grundzustand einer 
Statemachine . 

INITER-CT-BUS Bussystem zwischen den CTs einer Ebene 
und einer hoherliegenden CT (Oder CT-Gruppe) . 

INITIATOR CT, die einen Zugriff auf den Inter-CT- 

Bus startet. 

Pointer Zeiger auf eine Adresse bzw. ein 

Datenwort . 

konfigurierbares Element (KE) Ein konf igurierbares 

Element stellt eine Einheit eines Logik-Bausteines dar, 
welche durch ein Konf igurationswort fiir eine spezielle 
Funktion eingestellt werden kann. Konf igurierbare 
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Elemente sind somit, alle Arten von RAM Zellen, 
Multiplexer, Arithmetische logische Einheiten, Register 
und alle Arten von interner und externer 
Vernetzungsbeschreibung etc.} 

konfigurierbare Zelle (CEL) Siehe Logikzellen 

Konfigurieren Einstellen der Funktion und 

Vernetzung einer logischen Einheit, einer (FPGA) -Zelle 
Oder einer CEL (vgl. umkonf igurieren) . 

Konfigurationsdaten Beliebige Menge von 

Konf igurationsworten . 

Konfigurationsroutine (KR) Mehrere Konf igurationsworte 
zu einem Algorithmus zusanimengef iigte . 

Konfigurationsspeicher Der Konf igurationspeicher 

enthalt ein oder mehrere Konf igurationsworte . 

Konfigurationswort (KW) Ein Konf igurationswort 

besteht aus einer beliebig langen Bit-Reihe* Diese Bit- 
Reihe stellt eine giiltige Einstellung fur das zu 
konf igurierende Element dar, so das eine f unktionsf ahige 
Einheit entsteht. 

Ladelogik Einheit zum Konfigurieren und 

Umkonf igurieren der CEL. Ausgestaltet durch einen 
speziell an seine Aufgabe angepaliten Mikrokontroller . 

Logikzellen Bei DFPs, FPGAs, DPGAs verwendete 
konfigurierbare Zellen, die einfache logische oder 
arithmetische Aufgaben gemali ihrer Konf iguration 
erfiillen. 
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Lookup-Tabelle Stand der Technik. Verfahren zum 

Ubersetzen von Daten, 

LUTl Lookup-Tabelle, die einen Trigger auf eine ID 

ubersetzt und feststellt, ob der Trigger einer gultigen 
ID zugeordnet ist . 

LUT2 Lookup-Tabelle, die eine ID auf die Adresse 

der entsprechenden KR im lokalen Speicher ubersetzt und 
feststellt, Ob die KR im lokalen Speicher vorhanden ist. 

L-Pegel Logisch 0 Pegel, abhangig von der verwendeten 
Technologie 

Maske Bitkombination, die die gultigen Signale 
innerhalb einer Mehrzahl von Signalen angibt. 

Priorisierung Festlegung einer Reihenfolge. 

RECONFIG Rekonfigurierbarer Zustand einer CEL. 

RECONFIG-Trigger Setzen einer CEL in den 
rekonf igurierbaren Zustand, 

REJECT Signal, das anzeigt, daJJ die adressierte CEL 
sich in einem nicht konf igurierbaren Zustand befindet 
und das gesendete KW nicht annirrunt. 

REMOVE-<ID> 1. Befehl innerhalb eines KR zum 
Entfernen der durch ID ref erenzierten KR. 
2. Befehl einer iibergeordneten CT iiber ein separates 
Interface Oder Handshaking an eine untergeordnete CT zum 
loschen der durch ID referenzierten KR. 

RESET Rucksetzen eines Bausteines Oder eines ganzen 
Computersystems in einen definierten Grundzustand, 
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ROOT-CT CT der hochsten Hierarchieebene mit direktem 
Zugriff auf den externen Konf igurationsspeicher . 

Round-Robin-Arbiter Arbiter der im Kreis lauft und 

inimer dem zuletzt arbitrierten Signal die niederste 
Prioritat zuordnet. 

Statemachine siehe Zustandsrnaschine • 

Synchronisationssignale Status signale die von einem 

konfigurierbaren Element oder einem Rechenwerk generiert 
werden und zur Steuerung und Synchronisation der 
Datenverarbeitung an weitere konf igurierbare Element 
Oder Rechenwerke weitergeleitet werden, Es ist auch 
moglich ein Synchronisationssignal zeitlich verzogert 
(gespeichert) an ein und dasselbe konf igurierbare 
Element oder Rechenwerk zuriickzuleiten . 

TARGET CT, die einen Ziel eines Zugriffs auf den 

Inter-CT-Bus ist. 

Trigger Synonym fiir Synchronisationssignale. 

Umkonfigurieren Neues Konf igurieren von einer 
beliebigen Menge von CELs wahrend eine beliebige 
Restmenge von CELs ihre eigenen Funktionen fortsetzen 
(vgl. konf igurieren) . 

Verkettete-Liste Uber Pointer zusammengefugte 
Datenstruktur nach dem Stand der Technik. 

Zellen Synonym fur konf igurierbare Elemente 

Zustandsrnaschine Logik, die diversen Zustanden 

annehmen kann. Die Ubergange zwischen den Zustanden 
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sind von verschiedenen Eingangsparametern abhangig. 
Diese Maschinen werden zur Steuerung komplexer 
Funktionen eingesetzt und entsprechen dem Stand der 
Technik. 
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Patentanspruche 

1. Verfahren zum Cachen von Befehlen in aus mehreren 
Rechenwerken bestehenden Mikroprozessoren und in 
Bausteinen mit zwei- oder mehrdimensionaler 
Zellanordnung (z.B. FPGAs, DPGAs, DFPs, o.dgl.), dadurch 
gekennzeichnet, dafi 

1.1 mehrere Zellen und Rechenwerke (CEL) zu einer 

Mehrzahl von Gruppen zusammengef aJit werden, 
wobei jeder Teilgruppe eine Cache-Einheit (CT) 
zugeordnet ist, 

1.2 die Cache-Einheiten der einzelnen Teilgruppen 

werden iiber eine Baumstruktur an eine 
iibergeordnete Cache-Einheit (ROOT-CT) 
geschaltet, die Zugriff auf den 
Befehlsspeicher Speicher (ECR) besitzt, in dem 
die Befehle abgelegt sind, 

1.3 Befehle werden zu Bef ehlssquenzen (KR) 

zusammengef afit , die immer als ganze gecachet 
und zwischen den Caches iibertragen werden, 

1.4 jede Cache-Einheit auf unterster oder mittlerer 

Ebene des Baumes fordert die benotigten 
Befehle bei der jeweils iibergeordneten Cache- 
Einheit an, 

1.5 eine iibergeordnete Cache-Einheit sendet eine 

angeforderten Bef ehlssequenzen an die 
untergeordnete Einheit, sofern sie die 
Befehissequenzen in ihrem lokalen Speicher 
halt, 

1.6 eine iibergeordnete Cache-Einheit fordert eine 

angeforderten Befehissequenzen bei der ihr 
iibergeordneten Cache-Einheit an, sofern sie 
die Befehissequenzen nicht in ihrem lokalen 
Speicher halt. 
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2. Verfahren nach Anspruch 1, dadurch gekennzeichnet/ 
dafi 

Befehlssequenzen als Ganze geloscht, werden. 

3. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet, dali 

Befehlssequenzen einer Cache-Einheit geloscht werden, 
wenn nicht genugend Platz zum Laden einer weiteren 
angef orderten Bef ehlssequenz im lokalen Speicher 
vorhanden ist. 

4. Verfahren nach Anspruch 1 bis 2, dadurch 
gekennzeichnet, daft 

ein Befehl (REMOVE) innerhalb einer Befehlssequenz einen 
Vorgang auslost, durch den Befehlssequenzen einer Cache- 
Einheit geloscht werden. 

5. Verfahren nach Anspruch 1 bis 4, dadurch 
gekennzeichnet , dali 

ein Befehl (EXECUTE) innerhalb einer Befehlssequenz das 
Laden einer bestimmten kompletten Befehlssequenz 
auslost . 

6. Verfahren nach Anspruch 1 bis 5, dadurch 
gekennzeichnet^ dafi 

ein beliebiger Befehl (EXECUTE, REMOVE, etc.) iiber eine 
Busverbindung zwischen den Cache-Einheiten eine dem 
Befehl entsprechende Aktion auf einer bliebigen 
adressierten Cache-Einheit auslost. 

7. Verfahren nach Anspruch 1 bis 6, dadurch 
gekennzeichnet, dafi 

eine Programmsequenz, die nicht effektive cachebar ist-, 
da diese nur von einer Cache-Einheit verwendet wird, in 
kleine Teilsequenzen zerlegt wird, die von mehreren 
Cache-Einheiten benotigt werden, eine weitere 
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Teilsequenz (IKR) enthait den nicht cachebaren Rest der 
Befehlssequenz und die Aufrufe der cachebaren 
Teilsequenzen. 

8. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafi 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen iiber das Alter, d.h. der Verweildauer im 
Speicher der Cache-Einheit, der Befehlssequenz gibt. 

9. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dafi 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen uber die Haufigkeit der Aufrufe der 
Befehlssequenz gibt. 

10. Verfahren nach Anspruch 1 bis 7, dadurch 
gekennzeichnet, dali 

jeder Befehlssequenz eine Statistik zugeordnet ist, die 
Informationen Ober die LSnge der Befehlssequenz gibt . 

11. Verfahren nach Anspruch 1 bislO, dadurch 
gekennzeichnet, dafl 

die LSschroutine so ausgelegt ist, dafi sie die Statistik 
Deder Befehlssequenz auswertet und die entsprechend des 
ausgefUhrten Algorithmuses unwichtigste Befehlssequenz 
entfernt. 

12. Verfahren nach Anspruch 1 bis 11, dadurch 
gekennzeichnet, dafi 

die Loschroutine an den auszufiihrenden Algorithmus 
progranunierbar anpassbar ist. 
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